Implement parsing
This commit is contained in:
@@ -1,6 +1,7 @@
|
|||||||
add_library(imp
|
add_library(imp
|
||||||
am.c
|
am.c
|
||||||
memory_stream.c
|
memory_stream.c
|
||||||
|
parse.c
|
||||||
store.c
|
store.c
|
||||||
token.c
|
token.c
|
||||||
)
|
)
|
||||||
|
|||||||
27
lib/include/parse.h
Normal file
27
lib/include/parse.h
Normal file
@@ -0,0 +1,27 @@
|
|||||||
|
#ifndef PARSE_H
|
||||||
|
#define PARSE_H
|
||||||
|
|
||||||
|
#include "am.h"
|
||||||
|
#include "store.h"
|
||||||
|
#include "token.h"
|
||||||
|
|
||||||
|
#define PARSE_MAX_DEPTH 128U
|
||||||
|
|
||||||
|
typedef enum {
|
||||||
|
PARSE_STATE_INIT,
|
||||||
|
PARSE_STATE_LIST,
|
||||||
|
PARSE_STATE_DONE,
|
||||||
|
PARSE_STATE_ERROR,
|
||||||
|
} parse_state_t;
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
am_t *am;
|
||||||
|
store_t *store;
|
||||||
|
parse_state_t state;
|
||||||
|
parse_state_t *sp, stack[PARSE_MAX_DEPTH];
|
||||||
|
} parse_ctx_t;
|
||||||
|
|
||||||
|
void parse_init(am_t *am, store_t *store, parse_ctx_t *out);
|
||||||
|
parse_state_t parse_proc(parse_ctx_t *ctx, const token_t *token);
|
||||||
|
|
||||||
|
#endif
|
||||||
119
lib/parse.c
Normal file
119
lib/parse.c
Normal file
@@ -0,0 +1,119 @@
|
|||||||
|
#include "parse.h"
|
||||||
|
|
||||||
|
#include <assert.h>
|
||||||
|
#include <string.h>
|
||||||
|
|
||||||
|
void parse_init(am_t *am, store_t *store, parse_ctx_t *out)
|
||||||
|
{
|
||||||
|
out->am = am;
|
||||||
|
out->store = store;
|
||||||
|
out->state = PARSE_STATE_INIT;
|
||||||
|
out->sp = out->stack + PARSE_MAX_DEPTH - 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
static void push_state(parse_ctx_t *ctx, parse_state_t state)
|
||||||
|
{
|
||||||
|
assert(ctx->sp >= ctx->stack);
|
||||||
|
*ctx->sp-- = state;
|
||||||
|
}
|
||||||
|
|
||||||
|
static parse_state_t pop_state(parse_ctx_t *ctx)
|
||||||
|
{
|
||||||
|
assert(ctx->sp < ctx->stack + PARSE_MAX_DEPTH - 1);
|
||||||
|
return *++ctx->sp;
|
||||||
|
}
|
||||||
|
|
||||||
|
static void load_integer(parse_ctx_t *ctx, expr_t **expr, int64_t integer)
|
||||||
|
{
|
||||||
|
*expr = store_alloc(ctx->store);
|
||||||
|
(*expr)->is_atom = true;
|
||||||
|
(*expr)->atom.type = ATOM_TYPE_INTEGER;
|
||||||
|
(*expr)->atom.integer = integer;
|
||||||
|
}
|
||||||
|
|
||||||
|
static void
|
||||||
|
load_symbol(parse_ctx_t *ctx, expr_t **expr, const symbol_t *symbol)
|
||||||
|
{
|
||||||
|
*expr = store_alloc(ctx->store);
|
||||||
|
(*expr)->is_atom = true;
|
||||||
|
(*expr)->atom.type = ATOM_TYPE_SYMBOL;
|
||||||
|
memcpy(&(*expr)->atom.symbol, symbol, sizeof(symbol_t));
|
||||||
|
}
|
||||||
|
|
||||||
|
static expr_t **append(parse_ctx_t *ctx, expr_t *expr)
|
||||||
|
{
|
||||||
|
while (!expr->is_atom)
|
||||||
|
expr = expr->pair.cdr;
|
||||||
|
assert(expr->atom.type == ATOM_TYPE_EMPTY_LIST);
|
||||||
|
expr->is_atom = false;
|
||||||
|
expr->pair.cdr = store_alloc(ctx->store);
|
||||||
|
expr->pair.cdr->is_atom = true;
|
||||||
|
expr->pair.cdr->atom.type = ATOM_TYPE_EMPTY_LIST;
|
||||||
|
return &expr->pair.car;
|
||||||
|
}
|
||||||
|
|
||||||
|
parse_state_t parse_proc(parse_ctx_t *ctx, const token_t *token)
|
||||||
|
{
|
||||||
|
switch (ctx->state) {
|
||||||
|
case PARSE_STATE_INIT:
|
||||||
|
switch (token->type) {
|
||||||
|
case TOKEN_TYPE_INTEGER:
|
||||||
|
load_integer(ctx, &ctx->am->expr, token->integer);
|
||||||
|
ctx->state = PARSE_STATE_DONE;
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_SYMBOL:
|
||||||
|
load_symbol(ctx, &ctx->am->expr, &token->symbol);
|
||||||
|
ctx->state = PARSE_STATE_DONE;
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_OPEN_PAREN:
|
||||||
|
push_state(ctx, PARSE_STATE_DONE);
|
||||||
|
ctx->am->expr = store_alloc(ctx->store);
|
||||||
|
ctx->am->expr->is_atom = true;
|
||||||
|
ctx->am->expr->atom.type = ATOM_TYPE_EMPTY_LIST;
|
||||||
|
ctx->state = PARSE_STATE_LIST;
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_CLOSE_PAREN:
|
||||||
|
ctx->state = PARSE_STATE_ERROR;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
break;
|
||||||
|
|
||||||
|
case PARSE_STATE_LIST:
|
||||||
|
switch (token->type) {
|
||||||
|
expr_t **end_car;
|
||||||
|
case TOKEN_TYPE_INTEGER:
|
||||||
|
end_car = append(ctx, ctx->am->expr);
|
||||||
|
load_integer(ctx, end_car, token->integer);
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_SYMBOL:
|
||||||
|
end_car = append(ctx, ctx->am->expr);
|
||||||
|
load_symbol(ctx, end_car, &token->symbol);
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_OPEN_PAREN:
|
||||||
|
am_push(ctx->am);
|
||||||
|
push_state(ctx, PARSE_STATE_LIST);
|
||||||
|
ctx->am->expr = store_alloc(ctx->store);
|
||||||
|
ctx->am->expr->is_atom = true;
|
||||||
|
ctx->am->expr->atom.type = ATOM_TYPE_EMPTY_LIST;
|
||||||
|
ctx->state = PARSE_STATE_LIST;
|
||||||
|
break;
|
||||||
|
case TOKEN_TYPE_CLOSE_PAREN:
|
||||||
|
ctx->state = pop_state(ctx);
|
||||||
|
if (ctx->state == PARSE_STATE_LIST) {
|
||||||
|
expr_t *expr = ctx->am->expr;
|
||||||
|
am_pop(ctx->am);
|
||||||
|
end_car = append(ctx, ctx->am->expr);
|
||||||
|
*end_car = expr;
|
||||||
|
}
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
break;
|
||||||
|
|
||||||
|
case PARSE_STATE_DONE:
|
||||||
|
case PARSE_STATE_ERROR:
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
assert(ctx->state != PARSE_STATE_INIT);
|
||||||
|
return ctx->state;
|
||||||
|
}
|
||||||
@@ -10,6 +10,7 @@ endfunction()
|
|||||||
|
|
||||||
add_test_suites(
|
add_test_suites(
|
||||||
am_tests.c
|
am_tests.c
|
||||||
|
parse_tests.c
|
||||||
store_tests.c
|
store_tests.c
|
||||||
token_tests.c
|
token_tests.c
|
||||||
)
|
)
|
||||||
|
|||||||
229
tests/parse_tests.c
Normal file
229
tests/parse_tests.c
Normal file
@@ -0,0 +1,229 @@
|
|||||||
|
#include "parse.h"
|
||||||
|
#include "unity.h"
|
||||||
|
|
||||||
|
static store_t store;
|
||||||
|
static am_t am;
|
||||||
|
static parse_ctx_t ctx;
|
||||||
|
|
||||||
|
#define NELEMS(arr) (sizeof(arr) / sizeof(arr[0]))
|
||||||
|
|
||||||
|
void setUp(void)
|
||||||
|
{
|
||||||
|
store_init(&store);
|
||||||
|
am_init(&am);
|
||||||
|
parse_init(&am, &store, &ctx);
|
||||||
|
}
|
||||||
|
|
||||||
|
void tearDown(void)
|
||||||
|
{
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_integer_123(void)
|
||||||
|
{
|
||||||
|
const token_t token = { .type = TOKEN_TYPE_INTEGER, .integer = 123 };
|
||||||
|
|
||||||
|
const parse_state_t state = parse_proc(&ctx, &token);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_INTEGER, am.expr->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(123, am.expr->atom.integer);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_integer_321(void)
|
||||||
|
{
|
||||||
|
const token_t token = { .type = TOKEN_TYPE_INTEGER, .integer = 321 };
|
||||||
|
|
||||||
|
const parse_state_t state = parse_proc(&ctx, &token);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_INTEGER, am.expr->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(321, am.expr->atom.integer);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_symbol_foo(void)
|
||||||
|
{
|
||||||
|
const token_t token = {
|
||||||
|
.type = TOKEN_TYPE_SYMBOL,
|
||||||
|
.symbol = { .buf = "foo", .len = 3 },
|
||||||
|
};
|
||||||
|
|
||||||
|
const parse_state_t state = parse_proc(&ctx, &token);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_SYMBOL, am.expr->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(3, am.expr->atom.symbol.len);
|
||||||
|
TEST_ASSERT_EQUAL_MEMORY("foo", am.expr->atom.symbol.buf, 3);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_symbol_quux(void)
|
||||||
|
{
|
||||||
|
const token_t token = {
|
||||||
|
.type = TOKEN_TYPE_SYMBOL,
|
||||||
|
.symbol = { .buf = "quux", .len = 4 },
|
||||||
|
};
|
||||||
|
|
||||||
|
const parse_state_t state = parse_proc(&ctx, &token);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_SYMBOL, am.expr->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(4, am.expr->atom.symbol.len);
|
||||||
|
TEST_ASSERT_EQUAL_MEMORY("quux", am.expr->atom.symbol.buf, 4);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_open_paren_close_paren(void)
|
||||||
|
{
|
||||||
|
// ()
|
||||||
|
const token_t tokens[] = {
|
||||||
|
{ .type = TOKEN_TYPE_OPEN_PAREN },
|
||||||
|
{ .type = TOKEN_TYPE_CLOSE_PAREN },
|
||||||
|
};
|
||||||
|
parse_state_t state;
|
||||||
|
|
||||||
|
state = parse_proc(&ctx, tokens + 0);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_LIST, state);
|
||||||
|
state = parse_proc(&ctx, tokens + 1);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_EMPTY_LIST, am.expr->atom.type);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_open_paren_foo_42_close_paren(void)
|
||||||
|
{
|
||||||
|
// (foo 1) -> (foo . (1 . ()))
|
||||||
|
const token_t tokens[] = {
|
||||||
|
{ .type = TOKEN_TYPE_OPEN_PAREN },
|
||||||
|
{
|
||||||
|
.type = TOKEN_TYPE_SYMBOL,
|
||||||
|
.symbol = { .buf = "foo", .len = 3 },
|
||||||
|
},
|
||||||
|
{ .type = TOKEN_TYPE_INTEGER, .integer = 42 },
|
||||||
|
{ .type = TOKEN_TYPE_CLOSE_PAREN },
|
||||||
|
};
|
||||||
|
parse_state_t state;
|
||||||
|
|
||||||
|
for (unsigned i = 0; i < NELEMS(tokens) - 1; ++i) {
|
||||||
|
state = parse_proc(&ctx, tokens + i);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_LIST, state);
|
||||||
|
}
|
||||||
|
state = parse_proc(&ctx, tokens + NELEMS(tokens) - 1);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.car);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.car->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_SYMBOL, am.expr->pair.car->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(3, am.expr->pair.car->atom.symbol.len);
|
||||||
|
TEST_ASSERT_EQUAL_MEMORY("foo", am.expr->pair.car->atom.symbol.buf, 3);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->pair.cdr->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.car);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.car->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_INTEGER, am.expr->pair.cdr->pair.car->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(42, am.expr->pair.cdr->pair.car->atom.integer);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.cdr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.cdr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_EMPTY_LIST, am.expr->pair.cdr->pair.cdr->atom.type);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_open_paren_1_open_paren_2_close_paren_3_close_paren(void)
|
||||||
|
{
|
||||||
|
// (1 (2) 3) -> (1 . ((2 . ()) . (3 . ())))
|
||||||
|
const token_t tokens[] = {
|
||||||
|
{ .type = TOKEN_TYPE_OPEN_PAREN },
|
||||||
|
{ .type = TOKEN_TYPE_INTEGER, .integer = 1 },
|
||||||
|
{ .type = TOKEN_TYPE_OPEN_PAREN },
|
||||||
|
{ .type = TOKEN_TYPE_INTEGER, .integer = 2 },
|
||||||
|
{ .type = TOKEN_TYPE_CLOSE_PAREN },
|
||||||
|
{ .type = TOKEN_TYPE_INTEGER, .integer = 3 },
|
||||||
|
{ .type = TOKEN_TYPE_CLOSE_PAREN },
|
||||||
|
};
|
||||||
|
parse_state_t state;
|
||||||
|
|
||||||
|
for (unsigned i = 0; i < NELEMS(tokens) - 1; ++i) {
|
||||||
|
state = parse_proc(&ctx, tokens + i);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_LIST, state);
|
||||||
|
}
|
||||||
|
state = parse_proc(&ctx, tokens + NELEMS(tokens) - 1);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_DONE, state);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.car);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.car->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(ATOM_TYPE_INTEGER, am.expr->pair.car->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(1, am.expr->pair.car->atom.integer);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->pair.cdr->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.car);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->pair.cdr->pair.car->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.car->pair.car);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.car->pair.car->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_INTEGER, am.expr->pair.cdr->pair.car->pair.car->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
2, am.expr->pair.cdr->pair.car->pair.car->atom.integer);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.car->pair.cdr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.car->pair.cdr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_EMPTY_LIST,
|
||||||
|
am.expr->pair.cdr->pair.car->pair.cdr->atom.type);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.cdr);
|
||||||
|
TEST_ASSERT_FALSE(am.expr->pair.cdr->pair.cdr->is_atom);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.cdr->pair.car);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.cdr->pair.car->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_INTEGER, am.expr->pair.cdr->pair.cdr->pair.car->atom.type);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
3, am.expr->pair.cdr->pair.cdr->pair.car->atom.integer);
|
||||||
|
|
||||||
|
TEST_ASSERT_NOT_NULL(am.expr->pair.cdr->pair.cdr->pair.cdr);
|
||||||
|
TEST_ASSERT_TRUE(am.expr->pair.cdr->pair.cdr->pair.cdr->is_atom);
|
||||||
|
TEST_ASSERT_EQUAL(
|
||||||
|
ATOM_TYPE_EMPTY_LIST,
|
||||||
|
am.expr->pair.cdr->pair.cdr->pair.cdr->atom.type);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void test_close_paren(void)
|
||||||
|
{
|
||||||
|
const token_t token = { .type = TOKEN_TYPE_CLOSE_PAREN };
|
||||||
|
const parse_state_t state = parse_proc(&ctx, &token);
|
||||||
|
TEST_ASSERT_EQUAL(PARSE_STATE_ERROR, state);
|
||||||
|
}
|
||||||
|
|
||||||
|
int main(void)
|
||||||
|
{
|
||||||
|
UNITY_BEGIN();
|
||||||
|
RUN_TEST(test_integer_123);
|
||||||
|
RUN_TEST(test_integer_321);
|
||||||
|
RUN_TEST(test_symbol_foo);
|
||||||
|
RUN_TEST(test_symbol_quux);
|
||||||
|
RUN_TEST(test_open_paren_close_paren);
|
||||||
|
RUN_TEST(test_open_paren_foo_42_close_paren);
|
||||||
|
RUN_TEST(test_open_paren_1_open_paren_2_close_paren_3_close_paren);
|
||||||
|
RUN_TEST(test_close_paren);
|
||||||
|
return UNITY_END();
|
||||||
|
}
|
||||||
Reference in New Issue
Block a user