source: src/Parser/lex.ll @ 62afe08

Last change on this file since 62afe08 was 738a9b4, checked in by Peter A. Buhr <pabuhr@…>, 7 weeks ago

fformatting, make names consistent

  • Property mode set to 100644
File size: 21.4 KB
Line 
1/*
2 * Cforall Version 1.0.0 Copyright (C) 2015 University of Waterloo
3 *
4 * The contents of this file are covered under the licence agreement in the
5 * file "LICENCE" distributed with Cforall.
6 *
7 * lex.ll --
8 *
9 * Author           : Peter A. Buhr
10 * Created On       : Sat Sep 22 08:58:10 2001
11 * Last Modified By : Peter A. Buhr
12 * Last Modified On : Mon Sep 23 22:45:33 2024
13 * Update Count     : 792
14 */
15
16%option yylineno
17%option noyywrap
18%option nounput
19
20%{
21// The lexer assumes the program has been preprocessed by cpp. Hence, all user level preprocessor directive have been
22// performed and removed from the source. The only exceptions are preprocessor directives passed to the compiler (e.g.,
23// line-number directives) and C/C++ style comments, which are ignored.
24
25// *************************** Includes and Defines ****************************
26
27#ifdef __clang__
28#pragma GCC diagnostic ignored "-Wnull-conversion"
29#endif
30
31// trigger before each matching rule's action
32#define YY_USER_ACTION \
33        yylloc.first_line = yylineno; \
34        yylloc.first_column = column; \
35        column += yyleng; \
36        yylloc.last_column = column; \
37        yylloc.last_line = yylineno; \
38        yylloc.filename = yyfilename ? yyfilename : "";
39unsigned int column = 0;                                                                // position of the end of the last token parsed
40
41#include <string>
42#include <cstdio>                                                                               // FILENAME_MAX
43using namespace std;
44
45#include "config.h"                                                                             // configure info
46#include "DeclarationNode.hpp"                          // for DeclarationNode
47#include "ExpressionNode.hpp"                           // for LabelNode
48#include "InitializerNode.hpp"                          // for InitializerNode
49#include "ParseNode.hpp"
50#include "ParserTypes.hpp"                              // for Token
51#include "StatementNode.hpp"                            // for CondCtrl, ForCtrl
52#include "TypedefTable.hpp"
53// This (generated) header must come late as it is missing includes.
54#include "parser.hh"                                    // generated info
55
56string * build_postfix_name( string * name );
57
58char *yyfilename;
59string *strtext;                                                                                // accumulate parts of character and string constant value
60
61#define RETURN_LOCN(x)          yylval.tok.loc.file = yyfilename; yylval.tok.loc.line = yylineno; return( x )
62#define RETURN_VAL(x)           yylval.tok.str = new string( yytext ); RETURN_LOCN( x )
63#define RETURN_CHAR(x)          yylval.tok.str = nullptr; RETURN_LOCN( x )
64#define RETURN_STR(x)           yylval.tok.str = strtext; RETURN_LOCN( x )
65
66#define WHITE_RETURN(x)         // do nothing
67#define NEWLINE_RETURN()        column = 0; WHITE_RETURN( '\n' )
68#define ASCIIOP_RETURN()        RETURN_CHAR( (int)yytext[0] ) // single character operator
69#define NAMEDOP_RETURN(x)       RETURN_CHAR( x )                        // multichar operator, with a name
70#define NUMERIC_RETURN(x)       rm_underscore(); RETURN_VAL( x ) // numeric constant
71#define KEYWORD_RETURN(x)       RETURN_CHAR( x )                        // keyword
72#define QKEYWORD_RETURN(x)      RETURN_VAL(x);                          // quasi-keyword
73#define IDENTIFIER_RETURN()     RETURN_VAL( typedefTable.isKind( yytext ) )
74
75#ifdef HAVE_KEYWORDS_FLOATXX                                                    // GCC >= 7 => keyword, otherwise typedef
76#define FLOATXX(v) KEYWORD_RETURN(v);
77#else
78#define FLOATXX(v) IDENTIFIER_RETURN();
79#endif // HAVE_KEYWORDS_FLOATXX
80
81void rm_underscore() {
82        // SKULLDUGGERY: remove underscores (ok to shorten?)
83        yyleng = 0;
84        for ( int i = 0; yytext[i] != '\0'; i += 1 ) {          // copying non-underscore characters to front of string
85                if ( yytext[i] != '_' ) {
86                        yytext[yyleng] = yytext[i];
87                        yyleng += 1;
88                } // if
89        } // for
90        yytext[yyleng] = '\0';
91} // rm_underscore
92
93// Stop warning due to incorrectly generated flex code.
94#pragma GCC diagnostic ignored "-Wsign-compare"
95%}
96
97binary [0-1]
98octal [0-7]
99nonzero [1-9]
100decimal [0-9]
101hex [0-9a-fA-F]
102universal_char "\\"((u"_"?{hex_quad})|(U"_"?{hex_quad}{2}))
103
104                                // identifier, GCC: $ in identifier
105identifier ([a-zA-Z_$]|{universal_char})([0-9a-zA-Z_$]|{universal_char})*
106
107                                // numeric constants, CFA: '_' in constant
108hex_quad {hex}("_"?{hex}){3}
109size_opt (8|16|32|64|128)?
110                                // CFA: explicit l8/l16/l32/l64/l128, char 'hh', short 'h', int 'n'
111length ("ll"|"LL"|[lL]{size_opt})|("hh"|"HH"|[hHnN])
112                                // CFA: size_t 'z', pointer 'p', which define a sign and length
113integer_suffix_opt ("_"?(([uU]({length}?[iI]?)|([iI]{length}))|([iI]({length}?[uU]?)|([uU]{length}))|({length}([iI]?[uU]?)|([uU][iI]))|[zZ]|[pP]))?
114
115octal_digits ({octal})|({octal}({octal}|"_")*{octal})
116octal_prefix "0""_"?
117octal_constant (("0")|({octal_prefix}{octal_digits})){integer_suffix_opt}
118
119nonzero_digits ({nonzero})|({nonzero}({decimal}|"_")*{decimal})
120decimal_constant {nonzero_digits}{integer_suffix_opt}
121
122binary_digits ({binary})|({binary}({binary}|"_")*{binary})
123binary_prefix "0"[bB]"_"?
124binary_constant {binary_prefix}{binary_digits}{integer_suffix_opt}
125
126hex_digits ({hex})|({hex}({hex}|"_")*{hex})
127hex_prefix "0"[xX]"_"?
128hex_constant {hex_prefix}{hex_digits}{integer_suffix_opt}
129
130                                // GCC: floating D (double), imaginary iI, and decimal floating DF, DD, DL
131exponent "_"?[eE]"_"?[+-]?{decimal_digits}
132floating_size 16|32|32x|64|64x|80|128|128x
133floating_length ([fFdDlLwWqQ]|[fF]{floating_size})
134floating_suffix ({floating_length}?[iI]?)|([iI]{floating_length})
135decimal_floating_suffix [dD][fFdDlL]
136floating_suffix_opt ("_"?({floating_suffix}|{decimal_floating_suffix}))?
137decimal_digits ({decimal})|({decimal}({decimal}|"_")*{decimal})
138floating_decimal {decimal_digits}"."{exponent}?{floating_suffix_opt}
139floating_fraction "."{decimal_digits}{exponent}?{floating_suffix_opt}
140floating_constant ({decimal_digits}{exponent}{floating_suffix_opt})|({decimal_digits}{floating_fraction})
141
142binary_exponent "_"?[pP]"_"?[+-]?{decimal_digits}
143hex_floating_suffix_opt ("_"?({floating_suffix}))?
144hex_floating_fraction ({hex_digits}?"."{hex_digits})|({hex_digits}".")
145hex_floating_constant {hex_prefix}(({hex_floating_fraction}{binary_exponent})|({hex_digits}{binary_exponent})){hex_floating_suffix_opt}
146
147                                // character escape sequence, GCC: \e => esc character
148simple_escape "\\"[abefnrtv'"?\\]
149                                // ' stop editor highlighting
150octal_escape "\\"{octal}("_"?{octal}){0,2}
151hex_escape "\\""x""_"?{hex_digits}
152escape_seq {simple_escape}|{octal_escape}|{hex_escape}|{universal_char}
153cwide_prefix "L"|"U"|"u"
154swide_prefix {cwide_prefix}|"u8"
155
156                                // display/white-space characters
157h_tab [\011]
158form_feed [\014]
159v_tab [\013]
160c_return [\015]
161h_white [ ]|{h_tab}
162
163                                // overloadable operators
164op_unary_only "~"|"!"
165op_unary_binary "+"|"-"|"*"
166op_unary_pre_post "++"|"--"
167op_unary {op_unary_only}|{op_unary_binary}|{op_unary_pre_post}
168
169op_binary_only "/"|"%"|"\\"|"^"|"&"|"|"|"<"|">"|"="|"=="|"!="|"<<"|">>"|"<="|">="|"+="|"-="|"*="|"/="|"%="|"\\="|"&="|"|="|"^="|"<<="|">>="
170op_binary_over {op_unary_binary}|{op_binary_only}
171                                // op_binary_not_over "?"|"->"|"."|"&&"|"||"|"@="
172                                // operator {op_unary_pre_post}|{op_binary_over}|{op_binary_not_over}
173
174%x COMMENT
175%x BKQUOTE
176%x QUOTE
177%x STRING
178
179%%
180                                /* line directives */
181^{h_white}*"#"{h_white}*[0-9]+{h_white}*["][^"\n]+["].*"\n" {
182        /* " stop editor highlighting */
183        static char filename[FILENAME_MAX];                                     // temporarily store current source-file name
184        char *end_num;
185        char *begin_string, *end_string;
186        long lineno, length;
187        lineno = strtol( yytext + 1, &end_num, 0 );
188        begin_string = strchr( end_num, '"' );
189        if ( begin_string ) {                                                           // file name ?
190                end_string = strchr( begin_string + 1, '"' );   // look for ending delimiter
191                assert( end_string );                                                   // closing quote ?
192                length = end_string - begin_string - 1;                 // file-name length without quotes or sentinel
193                assert( length < FILENAME_MAX );                                // room for sentinel ?
194                memcpy( &filename, begin_string + 1, length );  // copy file name from yytext
195                filename[ length ] = '\0';                                              // terminate string with sentinel
196                //cout << "file " << filename << " line " << lineno << endl;
197                yylineno = lineno;
198                yyfilename = filename;
199        } // if
200}
201
202                                /* preprocessor-style directives */
203^{h_white}*"#"[^\n]*"\n" { RETURN_VAL( DIRECTIVE ); }
204
205                                /* ignore C style comments (ALSO HANDLED BY CPP) */
206"/*"                    { BEGIN COMMENT; }
207<COMMENT>.|\n   ;
208<COMMENT>"*/"   { BEGIN 0; }
209
210                                /* ignore C++ style comments (ALSO HANDLED BY CPP) */
211"//"[^\n]*"\n"  ;
212
213                                /* ignore whitespace */
214{h_white}+              { WHITE_RETURN(' '); }
215({v_tab}|{c_return}|{form_feed})+ { WHITE_RETURN(' '); }
216({h_white}|{v_tab}|{c_return}|{form_feed})*"\n" { NEWLINE_RETURN(); }
217
218                                /* keywords */
219alignas                 { KEYWORD_RETURN(ALIGNAS); }                    // CFA
220_Alignas                { KEYWORD_RETURN(ALIGNAS); }                    // C11
221alignof                 { KEYWORD_RETURN(ALIGNOF); }                    // CFA
222_Alignof                { KEYWORD_RETURN(ALIGNOF); }                    // C11
223__alignof               { KEYWORD_RETURN(ALIGNOF); }                    // GCC
224__alignof__             { KEYWORD_RETURN(ALIGNOF); }                    // GCC
225and                             { QKEYWORD_RETURN(WAND); }                              // CFA
226asm                             { KEYWORD_RETURN(ASM); }
227__asm                   { KEYWORD_RETURN(ASM); }                                // GCC
228__asm__                 { KEYWORD_RETURN(ASM); }                                // GCC
229_Atomic                 { KEYWORD_RETURN(ATOMIC); }                             // C11
230__attribute             { KEYWORD_RETURN(ATTRIBUTE); }                  // GCC
231__attribute__   { KEYWORD_RETURN(ATTRIBUTE); }                  // GCC
232auto                    { KEYWORD_RETURN(AUTO); }
233__auto_type             { KEYWORD_RETURN(AUTO_TYPE); }
234basetypeof              { KEYWORD_RETURN(BASETYPEOF); }                 // CFA
235_Bool                   { KEYWORD_RETURN(BOOL); }                               // C99
236__SVBool_t              { KEYWORD_RETURN(SVBOOL); }                             // gcc (ARM)
237break                   { KEYWORD_RETURN(BREAK); }
238case                    { KEYWORD_RETURN(CASE); }
239catch                   { QKEYWORD_RETURN(CATCH); }                             // CFA
240catchResume             { QKEYWORD_RETURN(CATCHRESUME); }               // CFA
241char                    { KEYWORD_RETURN(CHAR); }
242choose                  { KEYWORD_RETURN(CHOOSE); }                             // CFA
243coerce                  { KEYWORD_RETURN(COERCE); }                             // CFA
244corun                   { KEYWORD_RETURN(CORUN); }                              // CFA
245cofor                   { KEYWORD_RETURN(COFOR); }                              // CFA
246_Complex                { KEYWORD_RETURN(COMPLEX); }                    // C99
247__complex               { KEYWORD_RETURN(COMPLEX); }                    // GCC
248__complex__             { KEYWORD_RETURN(COMPLEX); }                    // GCC
249const                   { KEYWORD_RETURN(CONST); }
250__const                 { KEYWORD_RETURN(CONST); }                              // GCC
251__const__               { KEYWORD_RETURN(CONST); }                              // GCC
252continue                { KEYWORD_RETURN(CONTINUE); }
253coroutine               { KEYWORD_RETURN(COROUTINE); }                  // CFA
254_Decimal32              { KEYWORD_RETURN(DECIMAL32); }                  // GCC
255_Decimal64              { KEYWORD_RETURN(DECIMAL64); }                  // GCC
256_Decimal128             { KEYWORD_RETURN(DECIMAL128); }                 // GCC
257default                 { KEYWORD_RETURN(DEFAULT); }
258disable                 { KEYWORD_RETURN(DISABLE); }                    // CFA
259do                              { KEYWORD_RETURN(DO); }
260double                  { KEYWORD_RETURN(DOUBLE); }
261dtype                   { KEYWORD_RETURN(DTYPE); }                              // CFA
262else                    { KEYWORD_RETURN(ELSE); }
263enable                  { KEYWORD_RETURN(ENABLE); }                             // CFA
264enum                    { KEYWORD_RETURN(ENUM); }
265exception               { KEYWORD_RETURN(EXCEPTION); }                  // CFA
266__extension__   { KEYWORD_RETURN(EXTENSION); }                  // GCC
267extern                  { KEYWORD_RETURN(EXTERN); }
268fallthrough             { KEYWORD_RETURN(FALLTHROUGH); }                // CFA
269fallthru                { KEYWORD_RETURN(FALLTHRU); }                   // CFA
270finally                 { QKEYWORD_RETURN(FINALLY); }                   // CFA
271fixup                   { QKEYWORD_RETURN(FIXUP); }                             // CFA
272float                   { KEYWORD_RETURN(FLOAT); }
273__float80               { KEYWORD_RETURN(FLOAT80); }                    // GCC
274float80                 { KEYWORD_RETURN(FLOAT80); }                    // GCC
275__float128              { KEYWORD_RETURN(uuFLOAT128); }                 // GCC
276float128                { KEYWORD_RETURN(uuFLOAT128); }                 // GCC
277_Float16                { FLOATXX(FLOAT16); }                                   // GCC
278_Float32                { FLOATXX(FLOAT32); }                                   // GCC
279_Float32x               { FLOATXX(FLOAT32X); }                                  // GCC
280_Float64                { FLOATXX(FLOAT64); }                                   // GCC
281_Float64x               { FLOATXX(FLOAT64X); }                                  // GCC
282_Float128               { FLOATXX(FLOAT128); }                                  // GCC
283_Float128x              { FLOATXX(FLOAT128X); }                                 // GCC
284__Float32x4_t   { FLOATXX(FLOAT32X4); }                                 // GCC (ARM)
285__Float64x2_t   { FLOATXX(FLOAT64X2); }                                 // GCC (ARM)
286__SVFloat32_t   { FLOATXX(SVFLOAT32); }                                 // GCC (ARM)
287__SVFloat64_t   { FLOATXX(SVFLOAT64); }                                 // GCC (ARM)
288for                             { KEYWORD_RETURN(FOR); }
289forall                  { KEYWORD_RETURN(FORALL); }                             // CFA
290fortran                 { KEYWORD_RETURN(FORTRAN); }
291ftype                   { KEYWORD_RETURN(FTYPE); }                              // CFA
292generator               { KEYWORD_RETURN(GENERATOR); }                  // CFA
293_Generic                { KEYWORD_RETURN(GENERIC); }                    // C11
294goto                    { KEYWORD_RETURN(GOTO); }
295if                              { KEYWORD_RETURN(IF); }
296_Imaginary              { KEYWORD_RETURN(IMAGINARY); }                  // C99
297__imag                  { KEYWORD_RETURN(IMAGINARY); }                  // GCC
298__imag__                { KEYWORD_RETURN(IMAGINARY); }                  // GCC
299inline                  { KEYWORD_RETURN(INLINE); }                             // C99
300__inline                { KEYWORD_RETURN(INLINE); }                             // GCC
301__inline__              { KEYWORD_RETURN(INLINE); }                             // GCC
302int                             { KEYWORD_RETURN(INT); }
303int128                  { KEYWORD_RETURN(INT128); }                             // CFA
304__int128                { KEYWORD_RETURN(INT128); }                             // GCC
305__int128_t              { KEYWORD_RETURN(INT128); }                             // GCC
306__label__               { KEYWORD_RETURN(LABEL); }                              // GCC
307long                    { KEYWORD_RETURN(LONG); }
308monitor                 { KEYWORD_RETURN(MONITOR); }                    // CFA
309mutex                   { KEYWORD_RETURN(MUTEX); }                              // CFA
310_Noreturn               { KEYWORD_RETURN(NORETURN); }                   // C11
311__builtin_offsetof { KEYWORD_RETURN(OFFSETOF); }                // GCC
312one_t                   { NUMERIC_RETURN(ONE_T); }                              // CFA
313or                              { QKEYWORD_RETURN(WOR); }                               // CFA
314otype                   { KEYWORD_RETURN(OTYPE); }                              // CFA
315recover                 { QKEYWORD_RETURN(RECOVER); }                   // CFA
316register                { KEYWORD_RETURN(REGISTER); }
317report                  { KEYWORD_RETURN(THROWRESUME); }                // CFA
318restrict                { KEYWORD_RETURN(RESTRICT); }                   // C99
319__restrict              { KEYWORD_RETURN(RESTRICT); }                   // GCC
320__restrict__    { KEYWORD_RETURN(RESTRICT); }                   // GCC
321return                  { KEYWORD_RETURN(RETURN); }
322 /* resume                      { KEYWORD_RETURN(RESUME); }                             // CFA */
323short                   { KEYWORD_RETURN(SHORT); }
324signed                  { KEYWORD_RETURN(SIGNED); }
325__signed                { KEYWORD_RETURN(SIGNED); }                             // GCC
326__signed__              { KEYWORD_RETURN(SIGNED); }                             // GCC
327sizeof                  { KEYWORD_RETURN(SIZEOF); }
328countof                 { KEYWORD_RETURN(COUNTOF); }                    // GCC
329static                  { KEYWORD_RETURN(STATIC); }
330_Static_assert  { KEYWORD_RETURN(STATICASSERT); }               // C11
331static_assert   { KEYWORD_RETURN(STATICASSERT); }               // C23
332struct                  { KEYWORD_RETURN(STRUCT); }
333suspend                 { KEYWORD_RETURN(SUSPEND); }                    // CFA
334switch                  { KEYWORD_RETURN(SWITCH); }
335thread                  { KEYWORD_RETURN(THREAD); }                             // C11
336__thread                { KEYWORD_RETURN(THREADLOCALGCC); }             // GCC
337_Thread_local   { KEYWORD_RETURN(THREADLOCALC11); }             // C11
338thread_local    { KEYWORD_RETURN(THREADLOCALC11); }             // C23
339throw                   { KEYWORD_RETURN(THROW); }                              // CFA
340throwResume             { KEYWORD_RETURN(THROWRESUME); }                // CFA
341timeout                 { QKEYWORD_RETURN(TIMEOUT); }                   // CFA
342trait                   { KEYWORD_RETURN(TRAIT); }                              // CFA
343try                             { KEYWORD_RETURN(TRY); }                                // CFA
344ttype                   { KEYWORD_RETURN(TTYPE); }                              // CFA
345typedef                 { KEYWORD_RETURN(TYPEDEF); }
346typeof                  { KEYWORD_RETURN(TYPEOF); }                             // GCC
347__typeof                { KEYWORD_RETURN(TYPEOF); }                             // GCC
348__typeof__              { KEYWORD_RETURN(TYPEOF); }                             // GCC
349typeid                  { KEYWORD_RETURN(TYPEID); }                             // GCC
350union                   { KEYWORD_RETURN(UNION); }
351__uint128_t             { KEYWORD_RETURN(UINT128); }                    // GCC
352unsigned                { KEYWORD_RETURN(UNSIGNED); }
353__builtin_va_arg { KEYWORD_RETURN(VA_ARG); }                    // GCC
354__builtin_va_list { KEYWORD_RETURN(VA_LIST); }                  // GCC
355virtual                 { KEYWORD_RETURN(VIRTUAL); }                    // CFA
356void                    { KEYWORD_RETURN(VOID); }
357volatile                { KEYWORD_RETURN(VOLATILE); }
358__volatile              { KEYWORD_RETURN(VOLATILE); }                   // GCC
359__volatile__    { KEYWORD_RETURN(VOLATILE); }                   // GCC
360vtable                  { KEYWORD_RETURN(VTABLE); }                             // CFA
361waitfor                 { KEYWORD_RETURN(WAITFOR); }                    // CFA
362waituntil               { KEYWORD_RETURN(WAITUNTIL); }                  // CFA
363when                    { KEYWORD_RETURN(WHEN); }                               // CFA
364while                   { KEYWORD_RETURN(WHILE); }
365with                    { KEYWORD_RETURN(WITH); }                               // CFA
366zero_t                  { NUMERIC_RETURN(ZERO_T); }                             // CFA
367
368                                /* identifier */
369{identifier}    { IDENTIFIER_RETURN(); }
370"``"{identifier} {                                                                              // CFA
371        yytext[yyleng] = '\0'; yytext += 2;                                     // SKULLDUGGERY: remove backquotes (ok to shorten?)
372        IDENTIFIER_RETURN();
373}
374
375                                /* numeric constants */
376{binary_constant} { NUMERIC_RETURN(INTEGERconstant); }
377{octal_constant} { NUMERIC_RETURN(INTEGERconstant); }
378{decimal_constant} { NUMERIC_RETURN(INTEGERconstant); }
379{hex_constant}  { NUMERIC_RETURN(INTEGERconstant); }
380{floating_decimal}      { NUMERIC_RETURN(FLOATING_DECIMALconstant); } // must appear before floating_constant
381{floating_fraction}     { NUMERIC_RETURN(FLOATING_FRACTIONconstant); } // must appear before floating_constant
382{floating_constant}     { NUMERIC_RETURN(FLOATINGconstant); }
383{hex_floating_constant} { NUMERIC_RETURN(FLOATINGconstant); }
384
385                                /* character constant, allows empty value */
386({cwide_prefix}[_]?)?['] { BEGIN QUOTE; rm_underscore(); strtext = new string( yytext, yyleng ); }
387<QUOTE>[^'\\\n]* { strtext->append( yytext, yyleng ); }
388<QUOTE>['\n]    { BEGIN 0; strtext->append( yytext, yyleng ); RETURN_STR(CHARACTERconstant); }
389                                /* ' stop editor highlighting */
390
391                                /* string constant */
392({swide_prefix}[_]?)?["] { BEGIN STRING; rm_underscore(); strtext = new string( yytext, yyleng ); }
393<STRING>[^"\\\n]* { strtext->append( yytext, yyleng ); }
394<STRING>["\n]   { BEGIN 0; strtext->append( yytext, yyleng ); RETURN_STR(STRINGliteral); }
395                                /* " stop editor highlighting */
396
397                                /* common character/string constant */
398<QUOTE,STRING>{escape_seq} { rm_underscore(); strtext->append( yytext, yyleng ); }
399<QUOTE,STRING>"\\"{h_white}*"\n" {}                                             // continuation (ALSO HANDLED BY CPP)
400<QUOTE,STRING>"\\" { strtext->append( yytext, yyleng ); } // unknown escape character
401
402                                /* punctuation */
403"@"                             { ASCIIOP_RETURN(); }
404"`"                             { ASCIIOP_RETURN(); }
405"["                             { ASCIIOP_RETURN(); }
406"]"                             { ASCIIOP_RETURN(); }
407"("                             { ASCIIOP_RETURN(); }
408")"                             { ASCIIOP_RETURN(); }
409"{"                             { ASCIIOP_RETURN(); }
410"}"                             { ASCIIOP_RETURN(); }
411","                             { ASCIIOP_RETURN(); }                                   // also operator
412":"                             { ASCIIOP_RETURN(); }
413";"                             { ASCIIOP_RETURN(); }
414"."                             { ASCIIOP_RETURN(); }                                   // also operator
415"@@"                    { NAMEDOP_RETURN(ATTR); }                               // CFA, attribute shorthand
416"..."                   { NAMEDOP_RETURN(ELLIPSIS); }
417
418                                /* alternative C99 brackets, "<:" & "<:<:" handled by preprocessor */
419"<:"                    { RETURN_VAL('['); }
420":>"                    { RETURN_VAL(']'); }
421"<%"                    { RETURN_VAL('{'); }
422"%>"                    { RETURN_VAL('}'); }
423
424                                /* operators */
425"!"                             { ASCIIOP_RETURN(); }
426"+"                             { ASCIIOP_RETURN(); }
427"-"                             { ASCIIOP_RETURN(); }
428"*"                             { ASCIIOP_RETURN(); }
429"\\"                    { ASCIIOP_RETURN(); }                                   // CFA, exponentiation
430"/"                             { ASCIIOP_RETURN(); }
431"%"                             { ASCIIOP_RETURN(); }
432"^"                             { ASCIIOP_RETURN(); }
433"~"                             { ASCIIOP_RETURN(); }
434"&"                             { ASCIIOP_RETURN(); }
435"|"                             { ASCIIOP_RETURN(); }
436"<"                             { ASCIIOP_RETURN(); }
437">"                             { ASCIIOP_RETURN(); }
438"="                             { ASCIIOP_RETURN(); }
439"?"                             { ASCIIOP_RETURN(); }
440
441"++"                    { NAMEDOP_RETURN(ICR); }
442"--"                    { NAMEDOP_RETURN(DECR); }
443"=="                    { NAMEDOP_RETURN(EQ); }
444"!="                    { NAMEDOP_RETURN(NE); }
445"<<"                    { NAMEDOP_RETURN(LS); }
446">>"                    { NAMEDOP_RETURN(RS); }
447"<="                    { NAMEDOP_RETURN(LE); }
448">="                    { NAMEDOP_RETURN(GE); }
449"&&"                    { NAMEDOP_RETURN(ANDAND); }
450"||"                    { NAMEDOP_RETURN(OROR); }
451"->"                    { NAMEDOP_RETURN(ARROW); }
452"+="                    { NAMEDOP_RETURN(PLUSassign); }
453"-="                    { NAMEDOP_RETURN(MINUSassign); }
454"\\="                   { NAMEDOP_RETURN(EXPassign); }                  // CFA, exponentiation
455"*="                    { NAMEDOP_RETURN(MULTassign); }
456"/="                    { NAMEDOP_RETURN(DIVassign); }
457"%="                    { NAMEDOP_RETURN(MODassign); }
458"&="                    { NAMEDOP_RETURN(ANDassign); }
459"|="                    { NAMEDOP_RETURN(ORassign); }
460"^="                    { NAMEDOP_RETURN(ERassign); }
461"<<="                   { NAMEDOP_RETURN(LSassign); }
462">>="                   { NAMEDOP_RETURN(RSassign); }
463
464"@="                    { NAMEDOP_RETURN(ATassign); }                   // CFA
465"+~"                    { NAMEDOP_RETURN(ErangeUp); }                   // CFA
466"~="                    { NAMEDOP_RETURN(ErangeUpEq); }                 // CFA
467"+~="                   { NAMEDOP_RETURN(ErangeUpEq); }                 // CFA
468"-~"                    { NAMEDOP_RETURN(ErangeDown); }                 // CFA
469"-~="                   { NAMEDOP_RETURN(ErangeDownEq); }               // CFA
470
471                                /* CFA, operator identifier */
472{op_unary}"?"   { IDENTIFIER_RETURN(); }                                // unary
473"?"({op_unary_pre_post}|"()"|"[?]"|"{}") { IDENTIFIER_RETURN(); }
474"^?{}"                  { IDENTIFIER_RETURN(); }
475"?`"{identifier} {                                                                              // postfix operator
476        yylval.tok.str = new string( &yytext[2] );                      // remove ?`
477        yylval.tok.str = build_postfix_name( yylval.tok.str ); // add prefix
478        RETURN_LOCN( typedefTable.isKind( *yylval.tok.str ) );
479}
480"?"{op_binary_over}"?"  { IDENTIFIER_RETURN(); }                // binary
481        /*
482          This rule handles ambiguous cases with operator identifiers, e.g., "int *?*?()", where the string "*?*?"  can be
483          lexed as "*?"/"*?" or "*"/"?*?". Since it is common practise to put a unary operator juxtaposed to an identifier,
484          e.g., "*i", users will be annoyed if they cannot do this with respect to operator identifiers. Therefore, there is
485          a lexical look-ahead for the second case, with backtracking to return the leading unary operator and then
486          reparsing the trailing operator identifier.  Otherwise a space is needed between the unary operator and operator
487          identifier to disambiguate this common case.
488
489          A similar issue occurs with the dereference, *?(...), and routine-call, ?()(...) identifiers.  The ambiguity
490          occurs when the deference operator has no parameters, *?() and *?()(...), requiring arbitrary whitespace
491          look-ahead for the routine-call parameter-list to disambiguate.  However, the dereference operator must have a
492          parameter/argument to dereference *?(...).  Hence, always interpreting the string *?() as * ?() does not preclude
493          any meaningful program.
494
495          The remaining cases are with the increment/decrement operators and conditional expression:
496
497          i++? ...(...);
498          i?++ ...(...);
499
500          requiring arbitrary whitespace look-ahead for the operator parameter-list, even though that interpretation is an
501      incorrect expression (juxtaposed identifiers).  Therefore, it is necessary to disambiguate these cases with a
502      space:
503
504          i++ ? i : 0;
505          i? ++i : 0;
506        */
507{op_unary}"?"({op_unary_pre_post}|"()"|"[?]"|{op_binary_over}"?") {
508        // 1 or 2 character unary operator ?
509        int i = yytext[1] == '?' ? 1 : 2;
510        yyless( i );            // put back characters up to first '?'
511        if ( i > 1 ) {
512                NAMEDOP_RETURN( yytext[0] == '+' ? ICR : DECR );
513        } else {
514                ASCIIOP_RETURN();
515        } // if
516}
517
518                                /* unknown character */
519.                               { yyerror( "unknown character" ); }
520
521%%
522
523// ----end of lexer----
524
525void yyerror( const char * errmsg ) {
526        SemanticErrorThrow = true;
527        cerr << (yyfilename ? yyfilename : "*unknown file*") << ':' << yylineno << ':' << column - yyleng + 1
528                 << ": " << ErrorHelpers::error_str() << errmsg << " before token \"" << (yytext[0] == '\0' ? "EOF" : yytext) << '"' << endl;
529}
530
531// Local Variables: //
532// mode: c++ //
533// tab-width: 4 //
534// compile-command: "make install" //
535// End: //
Note: See TracBrowser for help on using the repository browser.