]> git.saurik.com Git - cycript.git/commitdiff
Massive changes to lexer to get template literals.
authorJay Freeman (saurik) <saurik@saurik.com>
Mon, 30 Nov 2015 14:16:22 +0000 (06:16 -0800)
committerJay Freeman (saurik) <saurik@saurik.com>
Mon, 30 Nov 2015 14:16:22 +0000 (06:16 -0800)
14 files changed:
Cycript.l.in
Cycript.yy.in
Driver.cpp
Driver.hpp
Highlight.cpp
Makefile.am
Makefile.in
NotLineTerminator.l [new file with mode: 0644]
Output.cpp
Parser.hpp
Replace.cpp
backtrack.sh
unicode.mk
unicode.py

index 42c45e209bb6d94914e76b36bbab11558a457904..ec251b601c26b2f2b8542ef01f518c6f6d02d034 100644 (file)
 **/
 /* }}} */
 
 **/
 /* }}} */
 
-/* XXX: supposedly I will be screwed on very very long multi-line comments and need to replace these with a manual lexer. http://websrv.cs.fsu.edu/~engelen/courses/COP5621/Pr2.pdf */
-
 %top{
 #if defined(__clang__)
 #pragma clang diagnostic push
 %top{
 #if defined(__clang__)
 #pragma clang diagnostic push
-#pragma clang diagnostic ignored "-Wunused-variable"
 #pragma clang diagnostic ignored "-Wdeprecated-register"
 #pragma clang diagnostic ignored "-Wdeprecated-register"
+#pragma clang diagnostic ignored "-Wunused-function"
+#pragma clang diagnostic ignored "-Wunused-variable"
 #else
 #pragma GCC diagnostic push
 #pragma GCC diagnostic ignored "-Wsign-compare"
 #else
 #pragma GCC diagnostic push
 #pragma GCC diagnostic ignored "-Wsign-compare"
@@ -70,12 +69,13 @@ typedef cy::parser::token tk;
 #define C \
     yyextra->newline_ = yyextra->last_; \
     yyextra->last_ = false; \
 #define C \
     yyextra->newline_ = yyextra->last_; \
     yyextra->last_ = false; \
-    BEGIN(Div);
+    BEGIN(yyextra->template_.top() ? DivOrTemplateTail : Div);
 
 #define N \
 
 #define N \
-    yyextra->last_ = true; \
-    if (yyextra->no_.NewLine) \
-        F(tk::NewLine, hi::Nothing);
+    if (yyextra->last_ && yyextra->no_.NewLine) { \
+        yyextra->last_ = false; \
+        F(tk::NewLine, hi::Nothing); \
+    }
 
 #define V(more) { \
     if (const char *nl = reinterpret_cast<const char *>(memchr(yytext, '\n', yyleng))) { \
 
 #define V(more) { \
     if (const char *nl = reinterpret_cast<const char *>(memchr(yytext, '\n', yyleng))) { \
@@ -93,16 +93,16 @@ typedef cy::parser::token tk;
     } else L \
 }
 
     } else L \
 }
 
-#define L { \
-    yylloc->step(); \
-    yylloc->end.columns(yyleng); \
-}
+#define R yylloc->end.columns(yyleng);
+#define L yylloc->step(); R
 
 
-#define M { \
-    if (yyextra->commented_) { \
-        I(comment, Comment(Y), tk::Comment, hi::Comment); \
-    } \
-}
+#define H(value, highlight) do { \
+    if (yyextra->highlight_) \
+        F(value, highlight); \
+} while (false)
+
+#define M \
+    H(tk::Comment, hi::Comment);
 
 #define E(message) { \
     CYDriver::Error error; \
 
 #define E(message) { \
     CYDriver::Error error; \
@@ -112,7 +112,7 @@ typedef cy::parser::token tk;
     yyterminate(); \
 }
 
     yyterminate(); \
 }
 
-int H(char c) {
+int X(char c) {
     if (c >= '0' && c <= '9')
         return c - '0';
     if (c >= 'a' && c <= 'f')
     if (c >= '0' && c <= '9')
         return c - '0';
     if (c >= 'a' && c <= 'f')
@@ -122,7 +122,8 @@ int H(char c) {
     return -1;
 }
 
     return -1;
 }
 
-static void U(char *&local, unsigned point) {
+template <typename Type_>
+static void U(Type_ &local, unsigned point) {
     if (false) {
     } else if (point < 0x000080) {
         *local++ = point;
     if (false) {
     } else if (point < 0x000080) {
         *local++ = point;
@@ -147,7 +148,7 @@ static void U(char *&local, const char *text, yy_size_t &i) {
 
     char next(text[++i]);
     if (next != '{') {
 
     char next(text[++i]);
     if (next != '{') {
-        point = H(text[i + 0]) << 12 | H(text[i + 1]) << 8 | H(text[i + 2]) << 4 | H(text[i + 3]);
+        point = X(text[i + 0]) << 12 | X(text[i + 1]) << 8 | X(text[i + 2]) << 4 | X(text[i + 3]);
         i += 3;
     } else {
         point = 0;
         i += 3;
     } else {
         point = 0;
@@ -155,13 +156,36 @@ static void U(char *&local, const char *text, yy_size_t &i) {
             next = text[++i];
             if (next == '}')
                 break;
             next = text[++i];
             if (next == '}')
                 break;
-            point = (point << 4) | H(next);
+            point = (point << 4) | X(next);
         }
     }
 
     U(local, point);
 }
 
         }
     }
 
     U(local, point);
 }
 
+#define CYLexBufferPoint(point) do { \
+    std::back_insert_iterator<std::vector<char> > inserter(yyextra->buffer_); \
+    U(inserter, point); \
+} while (false)
+
+#define CYLexBufferUnit(value) do { \
+    yyextra->buffer_.push_back(value); \
+} while (false)
+
+#define CYLexBufferUnits(data, size) do { \
+    yyextra->buffer_.insert(yyextra->buffer_.end(), data, data + size); \
+} while (false)
+
+#define CYLexBufferStart(condition) do { \
+    yyextra->buffer_.clear(); \
+    yy_push_state(condition, yyscanner); \
+} while (false)
+
+#define CYLexBufferEnd(type, Type, value, highlight) do { \
+    yy_pop_state(yyscanner); \
+    C I(type, Type(P.strmemdup(yyextra->buffer_.data(), yyextra->buffer_.size()), yyextra->buffer_.size()), value, highlight); \
+} while (false)
+
 #define YY_INPUT(data, value, size) { \
     if (yyextra->data_.eof()) \
         value = YY_NULL; \
 #define YY_INPUT(data, value, size) { \
     if (yyextra->data_.eof()) \
         value = YY_NULL; \
@@ -198,27 +222,26 @@ U0 [\x80-\xbf]
 U2 [\xc2-\xdf]
 U3 [\xe0-\xef]
 U4 [\xf0-\xf4]
 U2 [\xc2-\xdf]
 U3 [\xe0-\xef]
 U4 [\xf0-\xf4]
+UN [\xc0-\xc1\xf5-\xff]
 
 HexDigit [0-9a-fA-F]
 LineTerminatorSequence \r?\n|\r|\xe2\x80[\xa8\xa9]
 WhiteSpace [\x09\x0b\x0c\x20]|\xc2\xa0|\xef\xbb\xbf
 UnicodeEscape \\u({HexDigit}{4}|\{{HexDigit}+\})
 
 
 HexDigit [0-9a-fA-F]
 LineTerminatorSequence \r?\n|\r|\xe2\x80[\xa8\xa9]
 WhiteSpace [\x09\x0b\x0c\x20]|\xc2\xa0|\xef\xbb\xbf
 UnicodeEscape \\u({HexDigit}{4}|\{{HexDigit}+\})
 
-OctalEscape \\[1-7]|\\[4-7][0-7]|\\[0-3][0-7][0-7]?
-StringEscape \\['"\\bfnrtv]|\\0|{OctalEscape}|\\x{HexDigit}{2}|{UnicodeEscape}
-StringExtra {StringEscape}|\\{LineTerminatorSequence}
-SingleString ([^'\\\n]|{StringExtra})*
-DoubleString ([^"\\\n]|{StringExtra})*
-StringPrefix '{SingleString}|\"{DoubleString}
+@include NotLineTerminator.l
+CommentCharacter [^*/]{-}[\r\n\x80-\xff]|{NotLineTerminator}
+SingleCharacter [^'\\]{-}[\r\n\x80-\xff]|{NotLineTerminator}
+DoubleCharacter [^"\\]{-}[\r\n\x80-\xff]|{NotLineTerminator}
+PlateCharacter [^$`\\]{-}[\r\n\x80-\xff]|{NotLineTerminator}
 
 @include UnicodeIDStart.l
 @include UnicodeIDContinue.l
 
 @include UnicodeIDStart.l
 @include UnicodeIDContinue.l
-
 IdentifierMore [$_]
 
 UnicodeStart {IdentifierMore}|{UnicodeIDStart}
 UnicodePart {IdentifierMore}|\xe2\x80[\x8c\x8d]|{UnicodeIDContinue}
 IdentifierMore [$_]
 
 UnicodeStart {IdentifierMore}|{UnicodeIDStart}
 UnicodePart {IdentifierMore}|\xe2\x80[\x8c\x8d]|{UnicodeIDContinue}
-UnicodeFail {U2}|{U3}|{U3}{U0}|{U4}|{U4}{U0}|{U4}{U0}{U0}
+UnicodeFail {U2}|{U3}|{U3}{U0}|{U4}|{U4}{U0}|{U4}{U0}{U0}|{UN}|{U0}
 UnicodeScrap {UnicodePart}*{UnicodeFail}?
 
 IdentifierStart {UnicodeStart}|{UnicodeEscape}
 UnicodeScrap {UnicodePart}*{UnicodeFail}?
 
 IdentifierStart {UnicodeStart}|{UnicodeEscape}
@@ -240,8 +263,19 @@ XMLNamePart [a-zA-Z0-9.-_:]
 XMLName {XMLNameStart}{XMLNamePart}*
 @end
 
 XMLName {XMLNameStart}{XMLNamePart}*
 @end
 
+%x MultiLine
+
+%x LegacySingleString
+%x LegacyDoubleString
+
+%x StrictSingleString
+%x StrictDoubleString
+%x StrictAccentString
+
 %s Div
 %s Div
+%s DivOrTemplateTail
 %s RegExp
 %s RegExp
+%s RegExpOrTemplateTail
 
 @begin E4X
 %x XMLContent
 
 @begin E4X
 %x XMLContent
@@ -251,19 +285,25 @@ XMLName {XMLNameStart}{XMLNamePart}*
 %%
 
     /* RegEx {{{ */
 %%
 
     /* RegEx {{{ */
-<RegExp>\/{RegularExpressionBody}\/{RegularExpressionFlags} L C I(literal, RegEx(Y), tk::RegularExpressionLiteral, hi::Constant);
-<RegExp>\/{RegularExpressionBody}\/{RegularExpressionFlags}{UnicodeFail} L E("invalid flags")
-<RegExp>\/{RegularExpressionBody}?\\? L E("unterminated regex")
+<RegExp,RegExpOrTemplateTail>{
+    \/{RegularExpressionBody}\/{RegularExpressionFlags} L C I(literal, RegEx(Y), tk::RegularExpressionLiteral, hi::Constant);
+    \/{RegularExpressionBody}\/{RegularExpressionFlags}{UnicodeFail} L E("invalid flags")
+    \/{RegularExpressionBody}?\\? L E("unterminated regex")
+}
     /* }}} */
     /* Comment {{{ */
 #![^\n]* L M
 \/\/[^\n]* L M
 
     /* }}} */
     /* Comment {{{ */
 #![^\n]* L M
 \/\/[^\n]* L M
 
-    /* http://ostermiller.org/findcomment.html */
-    /* XXX: unify these two rules using !? */
-\/\*!([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+\/ V() C I(comment, Comment(Y), tk::Comment, hi::Comment);
-\/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+\/ V(N) M
-\/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\** V() E("invalid comment")
+\/\* L yy_push_state(MultiLine, yyscanner);
+
+<MultiLine>{
+    \**\*\/ R yy_pop_state(yyscanner); M N
+    \**{LineTerminatorSequence} yylloc->end.lines(); yyextra->last_ = true;
+    \**{CommentCharacter}|\/ R
+    \**({UnicodeFail}|\*) R E("invalid comment");
+    <<EOF>> R E("invalid comment")
+}
     /* }}} */
     /* Element {{{ */
 @begin E4X
     /* }}} */
     /* Element {{{ */
 @begin E4X
@@ -341,8 +381,8 @@ XMLName {XMLNameStart}{XMLNamePart}*
 "*="   L C F(tk::StarEqual, hi::Operator);
 "~"    L C F(tk::Tilde, hi::Operator);
 
 "*="   L C F(tk::StarEqual, hi::Operator);
 "~"    L C F(tk::Tilde, hi::Operator);
 
-<Div>"/"  L C F(tk::Slash, hi::Operator);
-<Div>"/=" L C F(tk::SlashEqual, hi::Operator);
+<Div,DivOrTemplateTail>"/"  L C F(tk::Slash, hi::Operator);
+<Div,DivOrTemplateTail>"/=" L C F(tk::SlashEqual, hi::Operator);
 
 ":"    L C F(tk::Colon, hi::Structure);
 ","    L C F(tk::Comma, hi::Structure);
 
 ":"    L C F(tk::Colon, hi::Structure);
 ","    L C F(tk::Comma, hi::Structure);
@@ -352,8 +392,8 @@ XMLName {XMLNameStart}{XMLNamePart}*
 "("    L C F(tk::OpenParen, hi::Structure);
 ")"    L C F(tk::CloseParen, hi::Structure);
 
 "("    L C F(tk::OpenParen, hi::Structure);
 ")"    L C F(tk::CloseParen, hi::Structure);
 
-"{"    L C F(yyextra->no_.OpenBrace ? tk::OpenBrace__ : yyextra->newline_ ? tk::OpenBrace_ : tk::OpenBrace, hi::Structure);
-"}"    L C F(tk::CloseBrace, hi::Structure);
+"{"    L yyextra->template_.push(false); C F(yyextra->no_.OpenBrace ? tk::OpenBrace__ : yyextra->newline_ ? tk::OpenBrace_ : tk::OpenBrace, hi::Structure);
+<Div,RegExp>"}" L yyextra->template_.pop(); C F(tk::CloseBrace, hi::Structure);
 
 "["    L C F(tk::OpenBracket, hi::Structure);
 "]"    L C F(tk::CloseBracket, hi::Structure);
 
 "["    L C F(tk::OpenBracket, hi::Structure);
 "]"    L C F(tk::CloseBracket, hi::Structure);
@@ -514,69 +554,77 @@ XMLName {XMLNameStart}{XMLNamePart}*
 (\.?[0-9]|(0|[1-9][0-9]*)\.){IdentifierScrap} L E("invalid number")
     /* }}} */
     /* String {{{ */
 (\.?[0-9]|(0|[1-9][0-9]*)\.){IdentifierScrap} L E("invalid number")
     /* }}} */
     /* String {{{ */
-'{SingleString}'|\"{DoubleString}\" L C {
-    char *value(A char[yyleng]);
-    char *local(value);
+\' L CYLexBufferStart(LegacySingleString);
+<LegacySingleString,StrictSingleString>{
+    \' R CYLexBufferEnd(string, String, tk::StringLiteral, hi::Constant);
+    {SingleCharacter}+ R CYLexBufferUnits(yytext, yyleng);
+    {SingleCharacter}*{UnicodeFail} R E("invalid character");
+    {LineTerminatorSequence} R E("invalid newline");
+}
 
 
-    for (yy_size_t i(1), e(yyleng - 1); i != e; ++i) {
-        char next(yytext[i]);
+\" L CYLexBufferStart(LegacyDoubleString);
+<LegacyDoubleString,StrictDoubleString>{
+    \" R CYLexBufferEnd(string, String, tk::StringLiteral, hi::Constant);
+    {DoubleCharacter}+ R CYLexBufferUnits(yytext, yyleng);
+    {DoubleCharacter}*{UnicodeFail} R E("invalid character");
+    {LineTerminatorSequence} R E("invalid newline");
+}
+    /* }}} */
+    /* Template {{{ */
+"`" L yyextra->tail_ = false; CYLexBufferStart(StrictAccentString);
+<DivOrTemplateTail,RegExpOrTemplateTail>"}" L yyextra->tail_ = true; yyextra->template_.pop(); CYLexBufferStart(StrictAccentString);
 
 
-        if (yytext[i] == '\\')
-            // XXX: support more line continuation characters
-            if (false) line: {
-                yylloc->end.lines(1);
-                yylloc->end.columns(yyleng - i);
-            } else switch (next = yytext[++i]) {
-                case '\n': goto line;
-
-                case '\\': next = '\\'; break;
-                case '\'': next = '\''; break;
-                case '"': next = '"'; break;
-                case 'b': next = '\b'; break;
-                case 'f': next = '\f'; break;
-                case 'n': next = '\n'; break;
-                case 'r': next = '\r'; break;
-                case 't': next = '\t'; break;
-                case 'v': next = '\v'; break;
-
-                case '0': case '1': case '2': case '3':
-                    if (yytext[i + 1] < '0' || yytext[i + 1] > '7')
-                        next = H(yytext[i]), i += 0;
-                    else if (yytext[i + 2] < '0' || yytext[i + 2] > '7')
-                        next = H(yytext[i]) << 3 | H(yytext[i + 1]), i += 1;
-                    else
-                        next = H(yytext[i]) << 6 | H(yytext[i + 1]) << 3 | H(yytext[i + 2]), i += 2;
-                break;
+<StrictAccentString>{
+    "`" R CYLexBufferEnd(string, String, yyextra->tail_ ? tk::TemplateTail : tk::NoSubstitutionTemplate, hi::Constant);
+    "${" R yyextra->template_.push(true); CYLexBufferEnd(string, String, yyextra->tail_ ? tk::TemplateMiddle : tk::TemplateHead, hi::Constant);
 
 
-                case '4': case '5': case '6': case '7':
-                    if (yytext[i + 1] < '0' || yytext[i + 1] > '7')
-                        next = H(yytext[i]), i += 0;
-                    else
-                        next = H(yytext[i]) << 3 | H(yytext[i + 1]), i += 1;
-                break;
+    "$" R CYLexBufferUnit('$');
+
+    {PlateCharacter}+ R CYLexBufferUnits(yytext, yyleng);
+    {PlateCharacter}*{UnicodeFail} R E("invalid character");
+    {LineTerminatorSequence} R E("invalid newline");
+}
+    /* }}} */
+    /* Escapes {{{ */
+<LegacySingleString,LegacyDoubleString>{
+    \\[0-3][0-7][0-7] R CYLexBufferPoint(X(yytext[1]) << 6 | X(yytext[2]) << 3 | X(yytext[3]));
+    \\[0-7][0-7] R CYLexBufferUnit(X(yytext[1]) << 3 | X(yytext[2]));
+    \\[0-7] R CYLexBufferUnit(X(yytext[1]));
+}
 
 
-                case 'x':
-                    U(local, H(yytext[i + 1]) << 4 | H(yytext[i + 2]));
-                    i += 2;
-                continue;
+<StrictSingleString,StrictDoubleString,StrictAccentString>{
+    \\0[0-7] R E("legacy escape");
+    \\0 R CYLexBufferUnit('\0');
+}
 
 
-                case 'u':
-                    U(local, yytext, i);
-                continue;
-            }
+<LegacySingleString,LegacyDoubleString,StrictSingleString,StrictDoubleString,StrictAccentString>{
+    \\b R CYLexBufferUnit('\b');
+    \\f R CYLexBufferUnit('\f');
+    \\n R CYLexBufferUnit('\n');
+    \\r R CYLexBufferUnit('\r');
+    \\t R CYLexBufferUnit('\t');
+    \\v R CYLexBufferUnit('\v');
 
 
-        *local++ = next;
+    \\x{HexDigit}{2} R CYLexBufferPoint(X(yytext[2]) << 4 | X(yytext[3]));
+
+    \\u{HexDigit}{4} R CYLexBufferPoint(X(yytext[2]) << 12 | X(yytext[3]) << 8 | X(yytext[4]) << 4 | X(yytext[5]));
+
+    \\u\{{HexDigit}+\} R {
+        unsigned point(0);
+        for (yy_size_t i(3); i != yyleng - 1; ++i)
+            point = point << 4 | X(yytext[i]);
+        CYLexBufferPoint(point);
     }
 
     }
 
-    *local = '\0';
-    I(string, String(value, local - value), tk::StringLiteral, hi::Constant);
-}
+    \\{LineTerminatorSequence} yylloc->end.lines();
+    \\(.|{NotLineTerminator}) R CYLexBufferUnits(yytext + 1, yyleng - 1);
 
 
-{StringPrefix}\\(x.{0,2}|u([^{].{0,3}|\{[^}]*)?|{UnicodeFail})? L E("invalid escape")
-{StringPrefix} L E("invalid string")
+    \\(x{HexDigit}{0,1}|u({HexDigit}{0,3}|\{{HexDigit}*)|{UnicodeFail})? R E("invalid escape");
+    <<EOF>> R E("invalid string");
+}
     /* }}} */
 
     /* }}} */
 
-{LineTerminatorSequence} yylloc->step(); yylloc->end.lines(); N
+{LineTerminatorSequence} yylloc->step(); yylloc->end.lines(); yyextra->last_ = true; N
 {WhiteSpace} L
 
 <<EOF>> if (yyextra->auto_) { yyextra->auto_ = false; F(tk::AutoComplete, hi::Nothing); } L yyterminate();
 {WhiteSpace} L
 
 <<EOF>> if (yyextra->auto_) { yyextra->auto_ = false; F(tk::AutoComplete, hi::Nothing); } L yyterminate();
@@ -594,27 +642,12 @@ void CYDriver::ScannerDestroy() {
     cylex_destroy(scanner_);
 }
 
     cylex_destroy(scanner_);
 }
 
-CYDriver::Condition CYDriver::GetCondition() {
-    switch (yy_top_state(scanner_)) {
-        case RegExp:
-            return RegExpCondition;
-@begin E4X
-        case XMLContent:
-            return XMLContentCondition;
-        case XMLTag:
-            return XMLTagCondition;
-@end
-        default:
-            _assert(false);
-    }
-}
-
 void CYDriver::SetCondition(Condition condition) {
     struct yyguts_t *yyg(reinterpret_cast<struct yyguts_t *>(scanner_));
 
     switch (condition) {
         case RegExpCondition:
 void CYDriver::SetCondition(Condition condition) {
     struct yyguts_t *yyg(reinterpret_cast<struct yyguts_t *>(scanner_));
 
     switch (condition) {
         case RegExpCondition:
-            BEGIN(RegExp);
+            BEGIN(template_.top() ? RegExpOrTemplateTail : RegExp);
             break;
 @begin E4X
         case XMLContentCondition:
             break;
 @begin E4X
         case XMLContentCondition:
index b656690195d385157fe71a51e8bdb20b6aa4ceb3..1215d39207be49bc6b8076c509ed15f01212a6b7 100644 (file)
@@ -48,7 +48,6 @@
 %union { CYBoolean *boolean_; }
 %union { CYClause *clause_; }
 %union { cy::Syntax::Catch *catch_; }
 %union { CYBoolean *boolean_; }
 %union { CYClause *clause_; }
 %union { cy::Syntax::Catch *catch_; }
-%union { CYComment *comment_; }
 %union { CYComprehension *comprehension_; }
 %union { CYDeclaration *declaration_; }
 %union { CYDeclarations *declarations_; }
 %union { CYComprehension *comprehension_; }
 %union { CYDeclaration *declaration_; }
 %union { CYDeclarations *declarations_; }
@@ -70,6 +69,7 @@
 %union { CYProperty *property_; }
 %union { CYPropertyName *propertyName_; }
 %union { CYRubyProc *rubyProc_; }
 %union { CYProperty *property_; }
 %union { CYPropertyName *propertyName_; }
 %union { CYRubyProc *rubyProc_; }
+%union { CYSpan *span_; }
 %union { CYStatement *statement_; }
 %union { CYString *string_; }
 %union { CYThis *this_; }
 %union { CYStatement *statement_; }
 %union { CYString *string_; }
 %union { CYThis *this_; }
@@ -222,7 +222,7 @@ _finline int yylex(cy::parser::semantic_type *semantic, CYLocation *location, vo
 %token SemiColon ";"
 %token NewLine "\n"
 
 %token SemiColon ";"
 %token NewLine "\n"
 
-%token <comment_> Comment
+%token Comment
 
 %token OpenParen "("
 %token CloseParen ")"
 
 %token OpenParen "("
 %token CloseParen ")"
@@ -362,6 +362,11 @@ _finline int yylex(cy::parser::semantic_type *semantic, CYLocation *location, vo
 %token <string_> StringLiteral
 %token <literal_> RegularExpressionLiteral
 
 %token <string_> StringLiteral
 %token <literal_> RegularExpressionLiteral
 
+%token <string_> NoSubstitutionTemplate
+%token <string_> TemplateHead
+%token <string_> TemplateMiddle
+%token <string_> TemplateTail
+
 %type <expression_> AdditiveExpression
 %type <argument_> ArgumentList_
 %type <argument_> ArgumentList
 %type <expression_> AdditiveExpression
 %type <argument_> ArgumentList_
 %type <argument_> ArgumentList
@@ -477,6 +482,8 @@ _finline int yylex(cy::parser::semantic_type *semantic, CYLocation *location, vo
 %type <statement_> StatementListOpt
 %type <statement_> StatementListItem
 %type <statement_> SwitchStatement
 %type <statement_> StatementListOpt
 %type <statement_> StatementListItem
 %type <statement_> SwitchStatement
+%type <expression_> TemplateLiteral
+%type <span_> TemplateSpans
 %type <statement_> ThrowStatement
 %type <statement_> TryStatement
 %type <expression_> UnaryExpression_
 %type <statement_> ThrowStatement
 %type <statement_> TryStatement
 %type <expression_> UnaryExpression_
@@ -799,6 +806,7 @@ PrimaryExpression
     | ArrayLiteral { $$ = $1; }
     | ObjectLiteral { $$ = $1; }
     | RegularExpressionLiteral { $$ = $1; }
     | ArrayLiteral { $$ = $1; }
     | ObjectLiteral { $$ = $1; }
     | RegularExpressionLiteral { $$ = $1; }
+    | TemplateLiteral { $$ = $1; }
     | CoverParenthesizedExpressionAndArrowParameterList { if ($1 == NULL) error(@1, "invalid parenthetical"); $$ = $1; }
     | AutoComplete { driver.mode_ = CYDriver::AutoPrimary; YYACCEPT; }
     ;
     | CoverParenthesizedExpressionAndArrowParameterList { if ($1 == NULL) error(@1, "invalid parenthetical"); $$ = $1; }
     | AutoComplete { driver.mode_ = CYDriver::AutoPrimary; YYACCEPT; }
     ;
@@ -888,8 +896,16 @@ InitializerOpt
     ;
 /* }}} */
 /* 12.2.9 Template Literals {{{ */
     ;
 /* }}} */
 /* 12.2.9 Template Literals {{{ */
-/* }}} */
+TemplateLiteral
+    : NoSubstitutionTemplate { $$ = CYNew CYTemplate($1, NULL); }
+    | TemplateHead TemplateSpans { $$ = CYNew CYTemplate($1, $2); }
+    ;
 
 
+TemplateSpans
+    : Expression TemplateMiddle TemplateSpans { $$ = CYNew CYSpan($1, $2, $3); }
+    | Expression TemplateTail { $$ = CYNew CYSpan($1, $2, NULL); }
+    ;
+/* }}} */
 
 /* 12.3+ Left-Hand-Side Expressions {{{ */
 MemberAccess
 
 /* 12.3+ Left-Hand-Side Expressions {{{ */
 MemberAccess
@@ -1542,7 +1558,6 @@ ClassMessageDeclaration
 
 ClassMessageDeclarationListOpt
     : ClassMessageDeclarationListOpt ClassMessageDeclaration { $2->SetNext($1); $$ = $2; }
 
 ClassMessageDeclarationListOpt
     : ClassMessageDeclarationListOpt ClassMessageDeclaration { $2->SetNext($1); $$ = $2; }
-    | ClassMessageDeclarationListOpt Comment { $$ = $1; }
     | { $$ = NULL; }
     ;
 
     | { $$ = NULL; }
     ;
 
@@ -1746,12 +1761,6 @@ Statement__
 
 @end
 
 
 @end
 
-/* YUI: Documentation Comments {{{ */
-Statement__
-    : Comment { $$ = $1; }
-    ;
-/* }}} */
-
 @begin E4X
 /* Lexer State {{{ */
 LexPushRegExp
 @begin E4X
 /* Lexer State {{{ */
 LexPushRegExp
index b9440223110fe0a7a0a2fd06524df1242eb67672..387a46d679fe24b600b43b7b041264f6ec082fa7 100644 (file)
@@ -29,7 +29,7 @@ CYDriver::CYDriver(CYPool &pool, std::istream &data, const std::string &filename
     data_(data),
     debug_(0),
     strict_(false),
     data_(data),
     debug_(0),
     strict_(false),
-    commented_(false),
+    highlight_(false),
     filename_(filename),
     script_(NULL),
     auto_(false),
     filename_(filename),
     script_(NULL),
     auto_(false),
@@ -38,6 +38,7 @@ CYDriver::CYDriver(CYPool &pool, std::istream &data, const std::string &filename
 {
     memset(&no_, 0, sizeof(no_));
     in_.push(false);
 {
     memset(&no_, 0, sizeof(no_));
     in_.push(false);
+    template_.push(false);
     ScannerInit();
 }
 
     ScannerInit();
 }
 
index a4458a237a4bca49f5dba063df0007af1fe90ca1..3f0a9600c6276029823ef842bd536205679f043f 100644 (file)
@@ -36,7 +36,11 @@ class _visible CYDriver {
     CYPool &pool_;
     void *scanner_;
 
     CYPool &pool_;
     void *scanner_;
 
+    std::vector<char> buffer_;
+    bool tail_;
+
     std::stack<bool> in_;
     std::stack<bool> in_;
+    std::stack<bool> template_;
 
     bool newline_;
     bool last_;
 
     bool newline_;
     bool last_;
@@ -53,7 +57,7 @@ class _visible CYDriver {
 
     int debug_;
     bool strict_;
 
     int debug_;
     bool strict_;
-    bool commented_;
+    bool highlight_;
 
     enum Condition {
         RegExpCondition,
 
     enum Condition {
         RegExpCondition,
@@ -112,7 +116,6 @@ class _visible CYDriver {
     bool Parse();
     void Replace(CYOptions &options);
 
     bool Parse();
     void Replace(CYOptions &options);
 
-    Condition GetCondition();
     void SetCondition(Condition condition);
 
     void PushCondition(Condition condition);
     void SetCondition(Condition condition);
 
     void PushCondition(Condition condition);
index 3e8aa7bff1ed90b4091c487d3956193be9bbef79..9c95728dd906d81a968c2c9bf5c7a274e772e672 100644 (file)
@@ -60,7 +60,7 @@ _visible void CYLexerHighlight(const char *data, size_t size, std::ostream &outp
 
     CYStream stream(data, data + size);
     CYDriver driver(pool, stream);
 
     CYStream stream(data, data + size);
     CYDriver driver(pool, stream);
-    driver.commented_ = true;
+    driver.highlight_ = true;
 
     size_t offset(0);
     CYPosition current;
 
     size_t offset(0);
     CYPosition current;
index 0519e2ddba7f1646c83db059af959452230031f0..a3da5f99cc9b7c80dbb2173877959fdfe09e4d32 100644 (file)
@@ -105,8 +105,9 @@ Cycript.l: Cycript.l.in UnicodeIDStart.l UnicodeIDContinue.l
 
 CLEANFILES += lex.cy.cpp
 lex.cy.cpp: Cycript.l
 
 CLEANFILES += lex.cy.cpp
 lex.cy.cpp: Cycript.l
-       $(FLEX) -o $@ $<
+       $(FLEX) -o $@ -T $< 2>lex.output || (grep -F '$<:' lex.output; false)
        grep -F 'No backing up.' lex.backup >/dev/null
        grep -F 'No backing up.' lex.backup >/dev/null
+       ! grep -F ': warning, ' lex.output || true
 
 Console.$(OBJEXT) Cycript.tab.lo Driver.lo Handler.lo Highlight.lo Library.lo lex.cy.lo: Cycript.tab.hh
 
 
 Console.$(OBJEXT) Cycript.tab.lo Driver.lo Handler.lo Highlight.lo Library.lo lex.cy.lo: Cycript.tab.hh
 
index 94714ce11c6609ddf2dde17d8cbe8a34b62e9284..d9411fccc5b59e447816bcf10a778f36d8766231 100644 (file)
@@ -1331,8 +1331,9 @@ Cycript.yy: Cycript.yy.in
 Cycript.l: Cycript.l.in UnicodeIDStart.l UnicodeIDContinue.l
        $(srcdir)/Filter.sh $< >$@ $(filters)
 lex.cy.cpp: Cycript.l
 Cycript.l: Cycript.l.in UnicodeIDStart.l UnicodeIDContinue.l
        $(srcdir)/Filter.sh $< >$@ $(filters)
 lex.cy.cpp: Cycript.l
-       $(FLEX) -o $@ $<
+       $(FLEX) -o $@ -T $< 2>lex.output || (grep -F '$<:' lex.output; false)
        grep -F 'No backing up.' lex.backup >/dev/null
        grep -F 'No backing up.' lex.backup >/dev/null
+       ! grep -F ': warning, ' lex.output || true
 
 Console.$(OBJEXT) Cycript.tab.lo Driver.lo Handler.lo Highlight.lo Library.lo lex.cy.lo: Cycript.tab.hh
 Cycript.tab.cc Cycript.tab.hh stack.hh Cycript.output: Cycript.yy
 
 Console.$(OBJEXT) Cycript.tab.lo Driver.lo Handler.lo Highlight.lo Library.lo lex.cy.lo: Cycript.tab.hh
 Cycript.tab.cc Cycript.tab.hh stack.hh Cycript.output: Cycript.yy
diff --git a/NotLineTerminator.l b/NotLineTerminator.l
new file mode 100644 (file)
index 0000000..0c48e7a
--- /dev/null
@@ -0,0 +1 @@
+NotLineTerminator [\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|\xe2\x80[\x80-\xa7\xa9-\xbf]|\xe2[\x81-\xbf][\x80-\xbf]|[\xe1\xe3-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|\xf4[\x80-\x8f][\x80-\xbf][\x80-\xbf]|[\xf1-\xf3][\x80-\xbf][\x80-\xbf][\x80-\xbf]
index 95d2f19ee51512cca7d5c5b477872f3f327469e7..9ec05c2044e100057f8c43489dbf7545add0ccaa 100644 (file)
@@ -183,13 +183,6 @@ void Catch::Output(CYOutput &out) const {
 
 } }
 
 
 } }
 
-void CYComment::Output(CYOutput &out, CYFlags flags) const {
-    out << '\r';
-    out(value_);
-    out.right_ = true;
-    out << '\r';
-}
-
 void CYCompound::Output(CYOutput &out, CYFlags flags) const {
     if (next_ == NULL)
         expression_->Output(out, flags);
 void CYCompound::Output(CYOutput &out, CYFlags flags) const {
     if (next_ == NULL)
         expression_->Output(out, flags);
@@ -510,6 +503,10 @@ void CYStatement::Output(CYOutput &out) const {
     Multiple(out);
 }
 
     Multiple(out);
 }
 
+void CYTemplate::Output(CYOutput &out, CYFlags flags) const {
+    _assert(false);
+}
+
 void CYTypeArrayOf::Output(CYOutput &out, CYIdentifier *identifier) const {
     next_->Output(out, Precedence(), identifier);
     out << '[';
 void CYTypeArrayOf::Output(CYOutput &out, CYIdentifier *identifier) const {
     next_->Output(out, Precedence(), identifier);
     out << '[';
index 2d78a479ab84de508afde9341ab79a08b3a52b05..93d44cb93727b3cc7078afdc86794699e96e3413 100644 (file)
@@ -272,22 +272,6 @@ struct CYIdentifier :
     CYIdentifier *Replace(CYContext &context);
 };
 
     CYIdentifier *Replace(CYContext &context);
 };
 
-struct CYComment :
-    CYStatement
-{
-    const char *value_;
-
-    CYComment(const char *value) :
-        value_(value)
-    {
-    }
-
-    CYCompact(None)
-
-    virtual CYStatement *Replace(CYContext &context);
-    virtual void Output(CYOutput &out, CYFlags flags) const;
-};
-
 struct CYLabel :
     CYStatement
 {
 struct CYLabel :
     CYStatement
 {
@@ -813,6 +797,43 @@ struct CYString :
     virtual void PropertyName(CYOutput &out) const;
 };
 
     virtual void PropertyName(CYOutput &out) const;
 };
 
+struct CYElement;
+
+struct CYSpan :
+    CYNext<CYSpan>
+{
+    CYExpression *expression_;
+    CYString *string_;
+
+    CYSpan(CYExpression *expression, CYString *string, CYSpan *next) :
+        CYNext<CYSpan>(next),
+        expression_(expression),
+        string_(string)
+    {
+    }
+
+    CYElement *Replace(CYContext &context);
+};
+
+struct CYTemplate :
+    CYExpression
+{
+    CYString *string_;
+    CYSpan *spans_;
+
+    CYTemplate(CYString *string, CYSpan *spans) :
+        string_(string),
+        spans_(spans)
+    {
+    }
+
+    CYPrecedence(0)
+    CYRightHand(false)
+
+    virtual CYExpression *Replace(CYContext &context);
+    virtual void Output(CYOutput &out, CYFlags flags) const;
+};
+
 struct CYNumber :
     CYTrivial,
     CYPropertyName
 struct CYNumber :
     CYTrivial,
     CYPropertyName
index 44a1143a43b09997802e801272f3b9b31c37c851..79e18d4546a21eef8cfd4d0033c3a52360e0b896 100644 (file)
@@ -151,10 +151,6 @@ void CYClause::Replace(CYContext &context) { $T()
     next_->Replace(context);
 }
 
     next_->Replace(context);
 }
 
-CYStatement *CYComment::Replace(CYContext &context) {
-    return this;
-}
-
 CYExpression *CYCompound::Replace(CYContext &context) {
     context.Replace(expression_);
     context.Replace(next_);
 CYExpression *CYCompound::Replace(CYContext &context) {
     context.Replace(expression_);
     context.Replace(next_);
@@ -857,6 +853,10 @@ void CYScope::Close(CYContext &context, CYStatement *&statements) {
         }
 }
 
         }
 }
 
+CYElement *CYSpan::Replace(CYContext &context) { $T(NULL)
+    return $ CYElement(expression_, $ CYElement(string_, next_->Replace(context)));
+}
+
 CYStatement *CYStatement::Return() {
     return this;
 }
 CYStatement *CYStatement::Return() {
     return this;
 }
@@ -885,6 +885,10 @@ CYStatement *CYSwitch::Replace(CYContext &context) {
     return this;
 }
 
     return this;
 }
 
+CYExpression *CYTemplate::Replace(CYContext &context) {
+    return $C2($M($M($M($V("String"), $S("prototype")), $S("concat")), $S("apply")), $S(""), $ CYArray($ CYElement(string_, spans_->Replace(context))));
+}
+
 CYExpression *CYThis::Replace(CYContext &context) {
     if (context.this_ != NULL)
         return $V(context.this_->Identifier(context));
 CYExpression *CYThis::Replace(CYContext &context) {
     if (context.this_ != NULL)
         return $V(context.this_->Identifier(context));
index a1eb8b447c3943a2e963a9739feadcbf464ee5dd..20b250faed15888c3fce992af5823ba671166c5b 100755 (executable)
@@ -1,3 +1,5 @@
 #!/bin/bash
 #!/bin/bash
-./apple-make.sh
-grep '^State' build.osx-i386/lex.backup | wc -l
+./apple-make.sh build-osx-i386
+echo "backup $(grep -c '^State ' build.osx-i386/lex.backup)"
+echo "states $(grep '^static .* yy_accept\[' build.osx-i386/lex.cy.cpp | sed -e 's/.*\[//;s/].*//') 3528"
+echo "jammed $(grep -F 'accepts: ['"$(grep 'jammed' build.osx-i386/lex.cy.cpp -B 3 | head -n 1 | sed -e 's/:$//;s/.* //')"']' build.osx-i386/lex.output | sed -e 's/.* # //;s/ .*//')"
index dc88024de6562b01298cd390ef625eba686a68d8..2d99709077e15cbfb35de4a7c774e5b2614ed207 100644 (file)
@@ -24,11 +24,14 @@ unicode := unicode.sh unicode.py
 unicode += DerivedCoreProperties.txt
 unicode += PropList.txt
 
 unicode += DerivedCoreProperties.txt
 unicode += PropList.txt
 
-all: UnicodeIDStart.l UnicodeIDContinue.l
+all: NotLineTerminator.l UnicodeIDStart.l UnicodeIDContinue.l
 
 %.txt:
        wget -qc http://www.unicode.org/Public/UCD/latest/ucd/$@
 
 
 %.txt:
        wget -qc http://www.unicode.org/Public/UCD/latest/ucd/$@
 
+NotLineTerminator.l: unicode.py
+       printf '80..2027\n2029..10ffff\n' | ./unicode.py NotLineTerminator >$@
+
 UnicodeIDStart.l: $(unicode)
        ./unicode.sh UnicodeIDStart ID_Start DerivedCoreProperties.txt Other_ID_Start PropList.txt >$@
 
 UnicodeIDStart.l: $(unicode)
        ./unicode.sh UnicodeIDStart ID_Start DerivedCoreProperties.txt Other_ID_Start PropList.txt >$@
 
index eebc83fc258e0815647c159dfc66487de03f505b..d5a10bc3a597b23c477ebe17e975230611caa976 100755 (executable)
@@ -90,6 +90,13 @@ def build(index, tree, units):
     for i in range(0, index):
         item += '[\\x80-\\xbf]'
 
     for i in range(0, index):
         item += '[\\x80-\\xbf]'
 
+    if False:
+        item = item.replace('[\\x00-\\x7f]', '{U1}')
+        item = item.replace('[\\x80-\\xbf]', '{U0}')
+        item = item.replace('[\\xc2-\\xdf]', '{U2}')
+        item = item.replace('[\\xe0-\\xef]', '{U3}')
+        item = item.replace('[\\xf0-\\xf4]', '{U4}')
+
     items.append(item)
     return False
 
     items.append(item)
     return False