https://github.com/felipensp/liblex

C library for Lexical Analysis
https://github.com/felipensp/liblex

c lex lexical lib tokenizer

Last synced: 6 months ago
JSON representation

C library for Lexical Analysis

Host: GitHub
URL: https://github.com/felipensp/liblex
Owner: felipensp
License: mit
Created: 2015-11-09T17:41:33.000Z (almost 10 years ago)
Default Branch: master
Last Pushed: 2015-12-13T12:54:13.000Z (almost 10 years ago)
Last Synced: 2025-03-27T11:43:23.849Z (7 months ago)
Topics: c, lex, lexical, lib, tokenizer
Language: C
Homepage:
Size: 48.8 KB
Stars: 30
Watchers: 5
Forks: 4
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          # liblex

C library for Lexical Analysis

[![Build Status](https://travis-ci.org/felipensp/liblex.svg?branch=master)](https://travis-ci.org/felipensp/liblex)

[![Join the chat at https://gitter.im/felipensp/liblex](https://badges.gitter.im/Join%20Chat.svg)](https://gitter.im/felipensp/liblex?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge&utm_content=badge)

#### Usage:

```c

/*

 * Lexer example

 * 

 * Author: Felipe Pena 

 */

 

#include 

#include 

enum { /* Tokens */

	MYLEXER_PLUS = 1,

	MYLEXER_MINUS,

	MYLEXER_DIV,

	MYLEXER_MULT,

	MYLEXER_MOD,

	MYLEXER_START_COMMENT,

	MYLEXER_END_COMMENT,

	MYLEXER_WHITESPACE,

	MYLEXER_NUMBER,

	MYLEXER_IGNORE

};

enum { /* States */

	INITIAL = 0,

	COMMENT

};

int start_comment_callback(llex *lex, char *str, size_t len) 

{

	llex_set_state(lex, COMMENT);

	return MYLEXER_START_COMMENT;

}

int end_comment_callback(llex *lex, char *str, size_t len) 

{

	llex_set_state(lex, INITIAL);

	return MYLEXER_END_COMMENT;

}

int number_callback(llex *lex, char *str, size_t len) 

{

	return MYLEXER_NUMBER;

}

int main(int argc, char **argv)

{

	llex lex;

	llex_token_id token_id;

		

	llex_init(&lex);

	llex_set_buffer(&lex, "1 - 2 + 3 / 4 \n"

						  "/* ignored str */");

	

	llex_set_state(&lex, INITIAL);

	llex_add_token_callback(&lex, "/*", start_comment_callback);

	

	llex_set_state(&lex, COMMENT);

	llex_add_token_callback(&lex, "*/", end_comment_callback);

	llex_add_token_regex(&lex, "(?:(?!\\*/).)+", MYLEXER_IGNORE);

	

	llex_set_state(&lex, INITIAL);

	llex_add_token(&lex, "+", MYLEXER_PLUS);

	llex_add_token(&lex, "-", MYLEXER_MINUS);

	llex_add_token(&lex, "/", MYLEXER_DIV);

	llex_add_token(&lex, "*", MYLEXER_MULT);

	llex_add_token_regex(&lex, "\\s+", MYLEXER_WHITESPACE);

	llex_add_token_regex_callback(&lex, "\\d+", number_callback);

	

	while ((token_id = llex_tokenizer(&lex)) > 0) {

		printf("Token id: %d - State: %d - '%.*s' - Start: %d:%d / End: %d:%d\n",

			token_id, 

			lex.current_state,

			lex.current_len,

			lex.current_token,

			lex.buffer_col_start,

			lex.buffer_line_start,

			lex.buffer_col_end,			

			lex.buffer_line_end);

	}

	if (token_id == -1) {

		printf("Unknown string `%s'\n", lex.current_token);

	}

	

	llex_cleanup(&lex);

	

	return 0;

}

```

Outputs:

```

Token id: 9 - State: 0 - '1' - Start: 0:1 / End: 1:1

Token id: 8 - State: 0 - ' ' - Start: 1:1 / End: 2:1

Token id: 2 - State: 0 - '-' - Start: 2:1 / End: 3:1

Token id: 8 - State: 0 - ' ' - Start: 3:1 / End: 4:1

Token id: 9 - State: 0 - '2' - Start: 4:1 / End: 5:1

Token id: 8 - State: 0 - ' ' - Start: 5:1 / End: 6:1

Token id: 1 - State: 0 - '+' - Start: 6:1 / End: 7:1

Token id: 8 - State: 0 - ' ' - Start: 7:1 / End: 8:1

Token id: 9 - State: 0 - '3' - Start: 8:1 / End: 9:1

Token id: 8 - State: 0 - ' ' - Start: 9:1 / End: 10:1

Token id: 3 - State: 0 - '/' - Start: 10:1 / End: 11:1

Token id: 8 - State: 0 - ' ' - Start: 11:1 / End: 12:1

Token id: 9 - State: 0 - '4' - Start: 12:1 / End: 13:1

Token id: 8 - State: 0 - ' 

' - Start: 13:1 / End: 1:2

Token id: 6 - State: 1 - '/*' - Start: 1:2 / End: 3:2

Token id: 10 - State: 1 - ' ignored str ' - Start: 3:2 / End: 16:2

Token id: 7 - State: 0 - '*/' - Start: 16:2 / End: 18:2

```

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/felipensp/liblex

Awesome Lists containing this project

README