Added parsing of command line options to set sample factor, disabling storage
[SXSI/xpathcomp.git] / main.ml
diff --git a/main.ml b/main.ml
index 10fd915..b342388 100644 (file)
--- a/main.ml
+++ b/main.ml
@@ -7,7 +7,7 @@
 INCLUDE "debug.ml"
 
 open Automaton
-let a = ref None
+
 
 let l = ref [] ;;
 let time f x =
@@ -21,58 +21,51 @@ let time f x =
 ;;
 let total_time () =  List.fold_left (+.) 0. !l;;
 
-let test filename query output = 
-  Printf.eprintf "Parsing document : %!";
-  let v = time Tree.Binary.parse_xml_uri filename in
-  Tree.Binary.print_xml_fast stderr v
-
 
 let main filename query output =
-  Printf.eprintf "Parsing document : %!";
-  let v = time Tree.Binary.parse_xml_uri filename in
-    MM(v,__LOCATION__);
-    a := Some (v);
-    a := None;
-    Tree.Binary.print_xml_fast stderr v;
-    Printf.eprintf "Parsing query : ";    
-    let query = try
-      time
-       XPath.Parser.parse_string query
-    with
-       Ulexer.Loc.Exc_located ((x,y),e) -> Printf.eprintf "character %i-%i %s\n" x y (Printexc.to_string e);exit 1
+    (* Just a trick to allow the C++ code to print debugging stuff first *)  
+    let v = time (fun () -> let v = Tree.Binary.parse_xml_uri filename;
+                 in Printf.eprintf "Parsing document : %!";v
+                ) () 
     in
-      Printf.eprintf "Compiling query : ";
-      let auto = time XPath.Compile.compile  query in
-       XPath.Ast.print Format.err_formatter query;
-       Format.eprintf "\n%!";
-
-       Printf.eprintf "TopDown (No BackTrack) : \n";
-       time (fun v -> ignore (TopDown.accept auto v)) v;
-       P(Printf.eprintf "Max states in TopDownNOBT : %i\n%!" auto.max_states);
-       begin
-         match output with
-           | None -> ()
-           | Some f ->
-               
-               Printf.eprintf "Serializing results : ";
+    let _ = Tag.init (Tree.Binary.tag_pool v) in
+      MM(v,__LOCATION__);
+      Printf.eprintf "Parsing query : ";    
+      let query = try
+       time
+         XPath.Parser.parse_string query
+      with
+         Ulexer.Loc.Exc_located ((x,y),e) -> Printf.eprintf "character %i-%i %s\n" x y (Printexc.to_string e);exit 1
+      in      
+       Printf.eprintf "Compiling query : ";
+       let auto = time XPath.Compile.compile  query in
+         XPath.Ast.print Format.err_formatter query;
+         Format.eprintf "\n%!";
+         (*            Format.eprintf "Internal rep of the tree is :\n%!";
+                       Tree.Binary.dump v;                           *)
+         Printf.eprintf "Execution time : ";
+         time (fun v -> ignore (TopDown.accept auto v)) v;
+         Printf.eprintf "Number of nodes in the result set : %i\n" (BST.cardinal auto.result);
+         begin
+           match output with
+             | None -> ()
+             | Some f ->
+                 
+                 Printf.eprintf "Serializing results : ";
                time( fun () ->
                        let oc = open_out f in
                          output_string oc "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n";
                          BST.iter (fun t -> Tree.Binary.print_xml_fast oc t;
-                                     output_string oc "\n------------------";
-                                   output_char oc '\n') auto.result) ();
+                                     output_char oc '\n') auto.result) ();
        end;
        Printf.eprintf "Total time : %fms\n Coherence : %i\n%!" (total_time())
 ;;
                
 
-let argc = Array.length Sys.argv;;
-if (argc < 3 || argc >4)
-then
-  (prerr_endline ("usage : " ^ Sys.argv.(0) ^ " <document> \'query\'[ <output> ]");
-   exit 1)
-;;
-
+Options.parse_cmdline();;
 
-test Sys.argv.(1) Sys.argv.(2) (if argc == 4 then Some Sys.argv.(3) else None) ;; 
+main !Options.input_file !Options.query !Options.output_file;;
 
+Printf.eprintf "\n=================================================\nDEBUGGING\n%!";
+Tree.DEBUGTREE.print_stats Format.err_formatter;;
+Gc.full_major()