grouped switch statement in parser, fix quotation issue, add value to token and consume it

thescripted · thescripted · commit 4df5cc91e852 · 2022-07-11T00:22:59.000-05:00
diff --git a/interpeter b/interpeter
diff --git a/main.go b/main.go
@@ -20,7 +20,7 @@ func run(code string) {
 	tokens := tokenScanner.Scan()
 	parser := NewParser(tokens)
 	expression := parser.Parse()
-	fmt.Printf("expression: %v\n", expression)
+	fmt.Printf("expression: %#v\n", expression)
 	// for _, token := range tokens {
 	// 	fmt.Printf("token: %v\n", token)
 	// }
diff --git a/parser.go b/parser.go
@@ -108,16 +108,8 @@ func (p *Parser) unary() Expression {
 func (p *Parser) primary() Expression {
 	literal := p.currentToken()
 	switch literal.t {
-	case NUMBER:
-		return LiteralExpression{value: literal.lexeme} // should be value
-	case STRING:
-		return LiteralExpression{value: literal.lexeme} // should be value
-	case TRUE:
-		return LiteralExpression{value: literal.lexeme} // should be value
-	case FALSE:
-		return LiteralExpression{value: literal.lexeme} // should be value
-	case NIL:
-		return LiteralExpression{value: literal.lexeme} // should be value
+	case NUMBER, STRING, TRUE, FALSE, NIL:
+		return LiteralExpression{value: literal.value}
 	case LEFT_PAREN:
 		p.advance(1)
 		expr := p.expression()
diff --git a/scanner.go b/scanner.go
@@ -1,6 +1,7 @@
 package main
 
 import (
+	"log"
 	"strconv"
 	"unicode"
 )
@@ -41,7 +42,7 @@ func NewTokenScanner(source string) *TokenScanner {
 // Scan takes in source code and emits tokens
 func (ts *TokenScanner) Scan() []Token {
 	var tokens []Token
-	for ts.current < len(ts.source) {
+	for !ts.finished() {
 		ts.start = ts.current
 		c := ts.source[ts.current]
 		switch c {
@@ -102,14 +103,22 @@ func (ts *TokenScanner) Scan() []Token {
 			} else {
 				tokens = ts.appendToken(tokens, SLASH)
 			}
-		case '"': // this is incorrect.
+		case '"':
 			for ts.current < len(ts.source) && ts.peek() != '"' {
 				ts.advance()
 			}
+			if ts.peek() == '"' {
+				ts.advance()
+			} else { // we didn't close the quotation. Berate the user.
+				log.Fatalf("stupid fucking user")
+			}
+			lexeme := ts.source[ts.start+1 : ts.current+1]
 			tokens = append(tokens, Token{
 				t:      STRING,
-				lexeme: ts.source[ts.start+1 : ts.current],
+				lexeme: lexeme,
+				value:  lexeme,
 			})
+
 		case ' ':
 		case '\r':
 		case '\t':
@@ -126,11 +135,15 @@ func (ts *TokenScanner) Scan() []Token {
 						ts.advance()
 					}
 				}
-				_, err := strconv.ParseFloat(ts.sliceToCurrent(), 64)
+				value, err := strconv.ParseFloat(ts.sliceToCurrent(), 64)
 				if err != nil {
 					panic(err) // oh god
 				}
-				tokens = ts.appendToken(tokens, NUMBER)
+				tokens = append(tokens, Token{
+					t:      NUMBER,
+					lexeme: ts.sliceToCurrent(), // still dont like this
+					value:  value,
+				})
 			} else if unicode.IsLetter(rune(c)) {
 				for unicode.IsLetter(rune(ts.peek())) || unicode.IsDigit(rune(ts.peek())) {
 					ts.advance()
@@ -140,13 +153,32 @@ func (ts *TokenScanner) Scan() []Token {
 				if val, ok := tokenKeywords[text]; ok {
 					tokenType = val
 				}
-				tokenType = IDENTIFIER
-				tokens = ts.appendToken(tokens, tokenType)
+				// can we do this elsewhere? I don't like this.
+				// we're also using append and appendToken a lot. Can this be unified?
+				switch tokenType {
+				case TRUE:
+					tokens = append(tokens, Token{
+						t:      TRUE,
+						lexeme: ts.sliceToCurrent(),
+						value:  true,
+					})
+				case FALSE:
+					tokens = append(tokens, Token{
+						t:      TRUE,
+						lexeme: ts.sliceToCurrent(),
+						value:  false,
+					})
+				case NIL:
+					tokens = append(tokens, Token{
+						t:      TRUE,
+						lexeme: ts.sliceToCurrent(),
+						value:  nil,
+					})
+				}
 
 			}
 		}
-
-		// advance to the next token on complete
+		// advance to the next token on complete. I don't like this much either. It's my code. I hate it all.
 		ts.advance()
 	}
 	return tokens
@@ -180,17 +212,19 @@ func (ts *TokenScanner) peekNext() byte {
 	return ts.source[ts.current+2]
 }
 
+// finished checks if we've completed scanning. Might not be useful. Only used in one spot.
 func (ts *TokenScanner) finished() bool {
 	if ts.current >= len(ts.source) {
 		return true
 	}
 	return false
 }
 
+// appendToken appends a token to the tokens array. It will not assign a value and its lexeme will be from the start to the current character.
 func (ts *TokenScanner) appendToken(tokens []Token, ttype TokenType) []Token { // really should be called "appendTokenWithAssumedLexeme"
 	token := Token{
 		t:      ttype,
-		lexeme: ts.sliceToCurrent(),
+		lexeme: ts.sliceToCurrent(), // I dont like this
 	}
 	return append(tokens, token)
 }
diff --git a/token.go b/token.go
@@ -57,8 +57,9 @@ const (
 type Token struct {
 	t      TokenType
 	lexeme string
+	value  interface{}
 }
 
 func (t Token) String() string {
-	return fmt.Sprintf("TokenType: %v, Lexeme: %v", t.t, t.lexeme)
+	return fmt.Sprintf("TokenType: %v, Lexeme: %v, Value: %v", t.t, t.lexeme, t.value)
 }

Original file line number	Diff line number	Diff line change
`@@ -57,8 +57,9 @@ const (`
`57`	`57`	`type Token struct {`
`58`	`58`	`t TokenType`
`59`	`59`	`lexeme string`
	`60`	`+ value interface{}`
`60`	`61`	`}`
`61`	`62`
`62`	`63`	`func (t Token) String() string {`
`63`		`- return fmt.Sprintf("TokenType: %v, Lexeme: %v", t.t, t.lexeme)`
	`64`	`+ return fmt.Sprintf("TokenType: %v, Lexeme: %v, Value: %v", t.t, t.lexeme, t.value)`
`64`	`65`	`}`