From a276149c38e11d9ef7f03c9272ce2de76a7356ef Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:21:25 -0400
Subject: [PATCH 1/6] Fix bug extracting functions

---
 python/egglog/egraph_state.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/egglog/egraph_state.py b/python/egglog/egraph_state.py
index 956ee0f..bb814af 100644
--- a/python/egglog/egraph_state.py
+++ b/python/egglog/egraph_state.py
@@ -493,7 +493,7 @@ def from_expr(self, tp: JustTypeRef, term: bindings._Term) -> TypedExprDecl:
             if term.name == "py-object":
                 call = bindings.termdag_term_to_expr(self.termdag, term)
                 expr_decl = PyObjectDecl(self.state.egraph.eval_py_object(call))
-            if term.name == "unstable-fn":
+            elif term.name == "unstable-fn":
                 # Get function name
                 fn_term, *arg_terms = term.args
                 fn_value = self.resolve_term(fn_term, JustTypeRef("String"))

From 214c5b751ffadc744cf3dd1b1a7298e5e151c3d4 Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:21:40 -0400
Subject: [PATCH 2/6] Make it possible to generate egg only code for jit

---
 python/egglog/exp/array_api_jit.py            |  9 +-
 python/egglog/exp/array_api_program_gen.py    | 24 +++--
 python/egglog/exp/program_gen.py              | 40 ++++----
 .../TestLDA.test_source_optimized.py          |  6 --
 python/tests/test_array_api.py                | 93 +++++++++++++------
 python/tests/test_program_gen.py              |  9 +-
 6 files changed, 109 insertions(+), 72 deletions(-)

diff --git a/python/egglog/exp/array_api_jit.py b/python/egglog/exp/array_api_jit.py
index 027049a..04138b6 100644
--- a/python/egglog/exp/array_api_jit.py
+++ b/python/egglog/exp/array_api_jit.py
@@ -17,18 +17,17 @@ def jit(fn: X) -> X:
     # 1. Create variables for each of the two args in the functions
     sig = inspect.signature(fn)
     arg1, arg2 = sig.parameters.keys()
-
-    with EGraph() as egraph:
+    egraph = EGraph()
+    with egraph:
         res = fn(NDArray.var(arg1), NDArray.var(arg2))
         egraph.register(res)
         egraph.run(array_api_numba_schedule)
         res_optimized = egraph.extract(res)
-        egraph.display(split_primitive_outputs=True, n_inline_leaves=3)
+        # egraph.display(split_primitive_outputs=True, n_inline_leaves=3)
 
-    egraph = EGraph()
     fn_program = ndarray_function_two(res_optimized, NDArray.var(arg1), NDArray.var(arg2))
     egraph.register(fn_program)
     egraph.run(array_api_program_gen_schedule)
-    fn = cast(X, egraph.eval(fn_program.py_object))
+    fn = cast(X, egraph.eval(egraph.extract(fn_program.py_object)))
     fn.expr = res_optimized  # type: ignore[attr-defined]
     return fn
diff --git a/python/egglog/exp/array_api_program_gen.py b/python/egglog/exp/array_api_program_gen.py
index cc3cb83..b6373f6 100644
--- a/python/egglog/exp/array_api_program_gen.py
+++ b/python/egglog/exp/array_api_program_gen.py
@@ -1,8 +1,6 @@
 # mypy: disable-error-code="empty-body"
 from __future__ import annotations
 
-import numpy as np
-
 from egglog import *
 
 from .array_api import *
@@ -13,9 +11,12 @@
 # Depends on `np` as a global variable.
 ##
 
-array_api_program_gen_ruleset = ruleset()
+array_api_program_gen_ruleset = ruleset(name="array_api_program_gen_ruleset")
+array_api_program_gen_eval_ruleset = ruleset(name="array_api_program_gen_eval_ruleset")
 
-array_api_program_gen_schedule = array_api_program_gen_ruleset.saturate() + program_gen_ruleset.saturate()
+array_api_program_gen_schedule = (
+    array_api_program_gen_ruleset | program_gen_ruleset | array_api_program_gen_eval_ruleset | eval_program_rulseset
+).saturate()
 
 
 @function
@@ -98,17 +99,14 @@ def _tuple_int_program(i: Int, ti: TupleInt, k: i64, idx_fn: Callable[[Int], Int
 def ndarray_program(x: NDArray) -> Program: ...
 
 
-@function
-def ndarray_function_two(res: NDArray, l: NDArray, r: NDArray) -> Program: ...
+@function(ruleset=array_api_program_gen_ruleset)
+def ndarray_function_two_program(res: NDArray, l: NDArray, r: NDArray) -> Program:
+    return ndarray_program(res).function_two(ndarray_program(l), ndarray_program(r))
 
 
-@array_api_program_gen_ruleset.register
-def _ndarray_function_two(f: Program, res: NDArray, l: NDArray, r: NDArray, o: PyObject):
-    # When we have function, set the program and trigger it to be compiled
-    yield rule(eq(f).to(ndarray_function_two(res, l, r))).then(
-        union(f).with_(ndarray_program(res).function_two(ndarray_program(l), ndarray_program(r))),
-        f.eval_py_object({"np": np}),
-    )
+@function(ruleset=array_api_program_gen_eval_ruleset)
+def ndarray_function_two(res: NDArray, l: NDArray, r: NDArray) -> EvalProgram:
+    return EvalProgram(ndarray_function_two_program(res, l, r), {"np": np})
 
 
 @function
diff --git a/python/egglog/exp/program_gen.py b/python/egglog/exp/program_gen.py
index 40ffc56..0ee74a5 100644
--- a/python/egglog/exp/program_gen.py
+++ b/python/egglog/exp/program_gen.py
@@ -83,8 +83,18 @@ def parent(self) -> Program:
         Only keeps the original parent, not any additional ones, so that each set of statements is only added once.
         """
 
-    @method(default=Unit())
-    def eval_py_object(self, globals: object) -> Unit:
+    @property
+    def is_identifer(self) -> Bool:
+        """
+        Returns whether the expression is an identifier. Used so that we don't re-assign any identifiers.
+        """
+
+
+converter(String, Program, Program)
+
+
+class EvalProgram(Expr):
+    def __init__(self, program: Program, globals: object) -> None:
         """
         Evaluates the program and saves as the py_object
         """
@@ -98,38 +108,34 @@ def py_object(self) -> PyObject:
         """
 
     @property
-    def is_identifer(self) -> Bool:
+    def statements(self) -> String:
         """
-        Returns whether the expression is an identifier. Used so that we don't re-assign any identifiers.
+        Returns the statements of the program, if it's been compiled
         """
 
 
-converter(String, Program, Program)
-
-program_gen_ruleset = ruleset()
-
-
-@program_gen_ruleset.register
-def _py_object(p: Program, expr: String, statements: String, g: PyObject):
+@ruleset
+def eval_program_rulseset(ep: EvalProgram, p: Program, expr: String, statements: String, g: PyObject):
     # When we evaluate a program, we first want to compile to a string
-    yield rule(p.eval_py_object(g)).then(p.compile())
+    yield rule(EvalProgram(p, g)).then(p.compile())
     # Then we want to evaluate the statements/expr
     yield rule(
-        p.eval_py_object(g),
+        eq(ep).to(EvalProgram(p, g)),
         eq(p.statements).to(statements),
         eq(p.expr).to(expr),
     ).then(
-        set_(p.py_object).to(
+        set_(ep.py_object).to(
             py_eval(
                 "l['___res']",
                 PyObject.dict(PyObject.from_string("l"), py_exec(join(statements, "\n", "___res = ", expr), g)),
             )
-        )
+        ),
+        set_(ep.statements).to(statements),
     )
 
 
-@program_gen_ruleset.register
-def _compile(
+@ruleset
+def program_gen_ruleset(
     s: String,
     s1: String,
     s2: String,
diff --git a/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py b/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
index cde790b..2b02b72 100644
--- a/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
+++ b/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
@@ -1,10 +1,4 @@
 def __fn(X, y):
-    assert X.dtype == np.dtype(np.float64)
-    assert X.shape == (150, 4,)
-    assert np.all(np.isfinite(X))
-    assert y.dtype == np.dtype(np.int64)
-    assert y.shape == (150,)
-    assert set(np.unique(y)) == set((0, 1, 2,))
     _0 = y == np.array(0)
     _1 = np.sum(_0)
     _2 = y == np.array(1)
diff --git a/python/tests/test_array_api.py b/python/tests/test_array_api.py
index f127e7e..c808911 100644
--- a/python/tests/test_array_api.py
+++ b/python/tests/test_array_api.py
@@ -9,6 +9,7 @@
 from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
 
 from egglog.exp.array_api import *
+from egglog.exp.array_api_jit import jit
 from egglog.exp.array_api_numba import array_api_numba_schedule
 from egglog.exp.array_api_program_gen import *
 
@@ -103,51 +104,69 @@ def _load_py_snapshot(fn: Callable, var: str | None = None) -> Any:
     return globals[var]
 
 
-def load_source(expr, egraph: EGraph):
-    with egraph:
-        fn_program = egraph.let("fn_program", ndarray_function_two(expr, NDArray.var("X"), NDArray.var("y")))
-        egraph.run(array_api_program_gen_schedule)
-        return egraph.eval(egraph.extract(fn_program.statements))
+def load_source(fn_program: EvalProgram, egraph: EGraph):
+    egraph.register(fn_program)
+    egraph.run(array_api_program_gen_schedule)
+    # dp the needed pieces in here for benchmarking
+    return egraph.eval(egraph.extract(fn_program.py_object))
 
 
-def trace_lda(egraph: EGraph):
-    X_arr = NDArray.var("X")
-    assume_dtype(X_arr, X_np.dtype)
-    assume_shape(X_arr, X_np.shape)
-    assume_isfinite(X_arr)
+def lda(X, y):
+    assume_dtype(X, X_np.dtype)
+    assume_shape(X, X_np.shape)
+    assume_isfinite(X)
 
-    y_arr = NDArray.var("y")
-    assume_dtype(y_arr, y_np.dtype)
-    assume_shape(y_arr, y_np.shape)
-    assume_value_one_of(y_arr, tuple(map(int, np.unique(y_np))))  # type: ignore[arg-type]
+    assume_dtype(y, y_np.dtype)
+    assume_shape(y, y_np.shape)
+    assume_value_one_of(y, tuple(map(int, np.unique(y_np))))  # type: ignore[arg-type]
+    return run_lda(X, y)
 
-    with egraph:
-        return run_lda(X_arr, y_arr)
+
+def simplify_lda(egraph: EGraph, expr: NDArray) -> NDArray:
+    egraph.register(expr)
+    egraph.run(array_api_numba_schedule)
+    return egraph.extract(expr)
 
 
 @pytest.mark.benchmark(min_rounds=3)
 class TestLDA:
+    """
+    Incrementally benchmark each part of the LDA to see how long it takes to run.
+    """
+
     def test_trace(self, snapshot_py, benchmark):
-        X_r2 = benchmark(trace_lda, EGraph())
+        X = NDArray.var("X")
+        y = NDArray.var("y")
+        with EGraph():
+            X_r2 = benchmark(lda, X, y)
         assert str(X_r2) == snapshot_py
 
     def test_optimize(self, snapshot_py, benchmark):
         egraph = EGraph()
-        expr = trace_lda(egraph)
-        simplified = benchmark(egraph.simplify, expr, array_api_numba_schedule)
+        X = NDArray.var("X")
+        y = NDArray.var("y")
+        with egraph:
+            expr = lda(X, y)
+            simplified = benchmark(simplify_lda, egraph, expr)
         assert str(simplified) == snapshot_py
 
-    @pytest.mark.xfail(reason="Original source is not working")
-    def test_source(self, snapshot_py, benchmark):
-        egraph = EGraph()
-        expr = trace_lda(egraph)
-        assert benchmark(load_source, expr, egraph) == snapshot_py
+    # @pytest.mark.xfail(reason="Original source is not working")
+    # def test_source(self, snapshot_py, benchmark):
+    #     egraph = EGraph()
+    #     expr = trace_lda(egraph)
+    #     assert benchmark(load_source, expr, egraph) == snapshot_py
 
     def test_source_optimized(self, snapshot_py, benchmark):
         egraph = EGraph()
-        expr = trace_lda(egraph)
-        optimized_expr = egraph.simplify(expr, array_api_numba_schedule)
-        assert benchmark(load_source, optimized_expr, egraph) == snapshot_py
+        X = NDArray.var("X")
+        y = NDArray.var("y")
+        with egraph:
+            expr = lda(X, y)
+            optimized_expr = simplify_lda(egraph, expr)
+        fn_program = ndarray_function_two(optimized_expr, X, y)
+        py_object = benchmark(load_source, fn_program, egraph)
+        assert np.allclose(py_object(X_np, y_np), res_np)
+        assert egraph.eval(fn_program.statements) == snapshot_py
 
     @pytest.mark.parametrize(
         "fn",
@@ -156,9 +175,29 @@ def test_source_optimized(self, snapshot_py, benchmark):
             pytest.param(run_lda, id="array_api"),
             pytest.param(_load_py_snapshot(test_source_optimized, "__fn"), id="array_api-optimized"),
             pytest.param(numba.njit(_load_py_snapshot(test_source_optimized, "__fn")), id="array_api-optimized-numba"),
+            pytest.param(jit(lda), id="array_api-jit"),
         ],
     )
     def test_execution(self, fn, benchmark):
         # warmup once for numba
         assert np.allclose(res_np, fn(X_np, y_np))
         benchmark(fn, X_np, y_np)
+
+
+# if calling as script, print out egglog source for test
+# similar to jit, but don't include pyobject parts so it works in vanilla egglog
+if __name__ == "__main__":
+    print("Generating egglog source for test")
+    egraph = EGraph(save_egglog_string=True)
+    X_ = NDArray.var("X")
+    y_ = NDArray.var("y")
+    with egraph:
+        expr = lda(X_, y_)
+    optimized_expr = egraph.simplify(expr, array_api_numba_schedule)
+    fn_program = ndarray_function_two_program(optimized_expr, X_, y_)
+    egraph.register(fn_program.compile())
+    egraph.run(array_api_program_gen_ruleset.saturate() + program_gen_ruleset.saturate())
+    egraph.extract(fn_program.statements)
+    name = "python.egg"
+    print("Saving to", name)
+    Path(name).write_text(egraph.as_egglog_string)
diff --git a/python/tests/test_program_gen.py b/python/tests/test_program_gen.py
index e3c156f..d714a9b 100644
--- a/python/tests/test_program_gen.py
+++ b/python/tests/test_program_gen.py
@@ -55,7 +55,7 @@ def test_to_string(snapshot_py) -> None:
     egraph = EGraph()
     egraph.register(fn)
     egraph.register(fn.compile())
-    egraph.run(to_program_ruleset * 100 + program_gen_ruleset * 200)
+    egraph.run((to_program_ruleset | program_gen_ruleset).saturate())
     # egraph.display(n_inline_leaves=1)
     assert egraph.eval(fn.expr) == "my_fn"
     assert egraph.eval(fn.statements) == snapshot_py
@@ -67,8 +67,9 @@ def test_py_object():
     z = Math.var("z")
     fn = (x + y + z).program.function_two(x.program, y.program)
     egraph = EGraph()
-    egraph.register(fn.eval_py_object({"z": 10}))
-    egraph.run(to_program_ruleset * 100 + program_gen_ruleset * 100)
-    res = egraph.eval(fn.py_object)
+    evalled = EvalProgram(fn, {"z": 10})
+    egraph.register(evalled)
+    egraph.run((to_program_ruleset | eval_program_rulseset | program_gen_ruleset).saturate())
+    res = egraph.eval(evalled.py_object)
     assert res(1, 2) == 13  # type: ignore[operator]
     assert inspect.getsource(res)  # type: ignore[arg-type]

From 6f5f20a8b2be4aeb6fc44ad31fc3891f07821170 Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:22:19 -0400
Subject: [PATCH 3/6] Changelog

---
 docs/changelog.md | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/docs/changelog.md b/docs/changelog.md
index 45ce62c..03cfbdd 100644
--- a/docs/changelog.md
+++ b/docs/changelog.md
@@ -5,6 +5,8 @@ _This project uses semantic versioning_
 ## UNRELEASED
 
 - Upgrade dependencies including [egglog](https://github.com/egraphs-good/egglog/compare/saulshanabrook:egg-smol:a555b2f5e82c684442775cc1a5da94b71930113c...b0db06832264c9b22694bd3de2bdacd55bbe9e32)
+- Fix bug with non glob star import
+- Fix bug extracting functions
 
 ## 8.0.0 (2024-10-17)
 

From 078f238d2b733ce09ea57da97eceb9039fab92fb Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:24:12 -0400
Subject: [PATCH 4/6] Undo change to source

---
 .../test_array_api/TestLDA.test_source_optimized.py         | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py b/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
index 2b02b72..cde790b 100644
--- a/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
+++ b/python/tests/__snapshots__/test_array_api/TestLDA.test_source_optimized.py
@@ -1,4 +1,10 @@
 def __fn(X, y):
+    assert X.dtype == np.dtype(np.float64)
+    assert X.shape == (150, 4,)
+    assert np.all(np.isfinite(X))
+    assert y.dtype == np.dtype(np.int64)
+    assert y.shape == (150,)
+    assert set(np.unique(y)) == set((0, 1, 2,))
     _0 = y == np.array(0)
     _1 = np.sum(_0)
     _2 = y == np.array(1)

From 12d5e41391f9c8557bc3e6945870df05fbafce45 Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:29:04 -0400
Subject: [PATCH 5/6] fix vars

---
 python/tests/test_array_api.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/tests/test_array_api.py b/python/tests/test_array_api.py
index c808911..b6daa22 100644
--- a/python/tests/test_array_api.py
+++ b/python/tests/test_array_api.py
@@ -163,7 +163,7 @@ def test_source_optimized(self, snapshot_py, benchmark):
         with egraph:
             expr = lda(X, y)
             optimized_expr = simplify_lda(egraph, expr)
-        fn_program = ndarray_function_two(optimized_expr, X, y)
+        fn_program = ndarray_function_two(optimized_expr, NDArray.var("X"), NDArray.var("y"))
         py_object = benchmark(load_source, fn_program, egraph)
         assert np.allclose(py_object(X_np, y_np), res_np)
         assert egraph.eval(fn_program.statements) == snapshot_py

From e492206b9bf2307c2befef8e0b0821fd8c2eb27c Mon Sep 17 00:00:00 2001
From: Saul Shanabrook <s.shanabrook@gmail.com>
Date: Wed, 23 Oct 2024 21:36:45 -0400
Subject: [PATCH 6/6] allow updating benchmarks

---
 .github/workflows/CI.yml | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/.github/workflows/CI.yml b/.github/workflows/CI.yml
index f3f1fd7..98fc098 100644
--- a/.github/workflows/CI.yml
+++ b/.github/workflows/CI.yml
@@ -69,7 +69,8 @@ jobs:
       - uses: CodSpeedHQ/action@v3
         with:
           token: ${{ secrets.CODSPEED_TOKEN }}
-          run: uv run pytest -vvv -n auto
+          # allow updating snapshots due to indeterministic benchmarks
+          run: uv run pytest -vvv -n auto  --snapshot-update
 
   docs:
     runs-on: ubuntu-latest