Removed testing cruft
[SXSI/xpathcomp.git] / OCamlDriver.cpp
1 /**************************************
2  * OCamlDriver.cpp
3  * -------------------
4  * A Test Ocaml Driver which calls the C++ methods and
5  * adds a C wrapper interface with OCaml code.
6  * 
7  * Author: Kim Nguyen
8  * Date: 04/11/08
9  */
10
11 /* OCaml memory managment */
12 extern "C" {
13 #include <caml/mlvalues.h>
14 #include <caml/alloc.h>
15 #include <caml/memory.h>
16 #include <caml/callback.h>
17 #include <caml/fail.h>
18 #include <caml/custom.h>
19   
20
21 } //extern C
22
23 //#include "TextCollection/TextCollection.h"
24 #include "XMLDocShredder.h"
25 #include "XMLTree.h"
26 #include "Utils.h"
27
28 #define CAMLRAISECPP(e) (caml_failwith( ((e).what())))
29 #define NOT_IMPLEMENTED(s)  (caml_failwith(s))
30 #define XMLTREE(x) ((XMLTree *)(* (XMLTree**) Data_custom_val(x)))
31 #define TEXTCOLLECTION(x)
32 #define TREENODEVAL(i) ((treeNode) (Int_val(i)))
33
34 extern "C" {
35   static struct custom_operations ops;
36   static bool initialized = false;
37 }
38 extern "C" void caml_xml_tree_finalize(value tree){
39   delete XMLTREE(tree);
40   return;
41 }
42
43 extern "C" void caml_init_ops () {
44
45   if (initialized)
46     return; 
47   ops.identifier = (char*) "XMLTree";
48   ops.finalize = caml_xml_tree_finalize;
49   return;
50 }
51
52 extern "C" CAMLprim value caml_call_shredder_uri(value uri,value sf, value iet, value dtc){
53   CAMLparam1(uri);
54   CAMLlocal1(doc);
55   char *fn = String_val(uri);
56   try {
57     XMLDocShredder shredder(fn,Int_val(sf),Bool_val(iet),Bool_val(dtc));
58   XMLTree * tree;
59   shredder.processStartDocument(fn);  
60   shredder.parse();  
61   shredder.processEndDocument();
62   caml_init_ops();
63   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
64   tree = (XMLTree *) shredder.storageIfc_->returnDocument();
65   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
66   CAMLreturn(doc);
67   }
68   catch (const std::exception& e){
69     CAMLRAISECPP(e);
70   };
71   
72 }
73
74 extern "C" CAMLprim value caml_call_shredder_string(value data,value sf, value iet, value dtc){
75   CAMLparam1(data);
76   CAMLlocal1(doc);
77   unsigned int ln = string_length(data);
78   unsigned char *fn = (unsigned char*) String_val(data);
79   
80   try {
81     XMLDocShredder shredder(fn,ln,Int_val(sf),Bool_val(iet),Bool_val(dtc));  
82     XMLTree* tree;
83     shredder.processStartDocument("");  
84     shredder.parse();  
85     shredder.processEndDocument();
86     caml_init_ops();
87     doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
88     tree = (XMLTree *) shredder.storageIfc_->returnDocument();
89     memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
90     CAMLreturn(doc);
91   }
92   catch (const std::exception& e) {
93     CAMLRAISECPP(e);
94   };
95 }
96
97 void traversal_rec(XMLTree* tree, treeNode id){
98  DocID tid; 
99   if (id == NULLT)
100     return;
101   //  int tag = tree->Tag(id);
102    if (id) {
103         tid = tree->PrevText(id);
104         char * data = (char *) (tree->getTextCollection())->GetText(tid);
105         if (tree->IsLeaf(id)){
106           tid = tree->MyText(id);
107
108           data = (char*) (tree->getTextCollection())->GetText(tid);
109         };
110   
111         if (tree->NextSibling(id) == NULLT){
112           tid = tree->NextText(id);
113           data = (char*) (tree->getTextCollection())->GetText(tid);
114         }; 
115    };
116    traversal_rec(tree,tree->FirstChild(id));
117    traversal_rec(tree,tree->NextSibling(id));
118    return;
119 }
120
121 extern "C" CAMLprim value caml_cpp_traversal(value tree){
122   CAMLparam1(tree);
123   traversal_rec(XMLTREE(tree),XMLTREE(tree)->Root());
124   CAMLreturn(Val_unit);
125 }
126
127 extern "C" CAMLprim value caml_text_collection_get_text(value tree, value id){
128   CAMLparam2(tree,id);
129   CAMLlocal1(str);
130   uchar* txt = XMLTREE(tree)->GetText((DocID) Int_val(id));
131   str = caml_copy_string((const char*)txt);
132   delete (txt);
133   CAMLreturn (str);
134 }
135
136 extern "C" CAMLprim value caml_text_collection_get_cached_text(value tree, value id){
137   CAMLparam2(tree,id);
138   CAMLlocal1(str);
139   char* txt = (char*) XMLTREE(tree)->GetCachedText((DocID) Int_val(id));
140   str = caml_copy_string(txt);
141   free(txt);
142   CAMLreturn (str);
143 }
144
145 extern "C" CAMLprim value caml_text_collection_size(value tree){
146   CAMLparam1(tree);
147   //  CAMLreturn (Val_int( XMLTREE(tree)->CachedText.size()));
148   NOT_IMPLEMENTED("text_collection_size");
149   CAMLreturn (Val_unit);
150 }
151
152
153
154 extern "C" CAMLprim value caml_text_collection_empty_text(value tree,value id){
155   CAMLparam2(tree,id);
156   CAMLreturn ( Val_int((XMLTREE(tree))->EmptyText((DocID) Int_val(id))));
157 }
158
159 extern "C" CAMLprim value caml_text_collection_is_contains(value tree,value str){
160   CAMLparam2(tree,str);
161   uchar * cstr = (uchar *) String_val(str);  
162   CAMLreturn ( Val_bool((int) XMLTREE(tree)->IsContains(cstr)));
163 }
164
165 extern "C" CAMLprim value caml_text_collection_count_contains(value tree,value str){
166   CAMLparam2(tree,str);
167   uchar * cstr = (uchar *) String_val(str);  
168   CAMLreturn (Val_int((XMLTREE(tree)->CountContains(cstr))));
169   
170 }
171 extern "C" CAMLprim value caml_text_collection_count(value tree,value str){
172   CAMLparam2(tree,str);
173   //uchar * cstr = (uchar *) String_val(str);
174   NOT_IMPLEMENTED("text_collection_count");
175   CAMLreturn (Val_unit);
176   
177 }
178
179 extern "C" CAMLprim value caml_text_collection_contains(value tree,value str){
180   CAMLparam2(tree,str);
181   CAMLlocal1(resarray);
182   uchar * cstr = (uchar *) String_val(str);  
183   std::vector<DocID> results;
184   results = XMLTREE(tree)->Contains(cstr);
185   //free(cstr);
186   resarray = caml_alloc_tuple(results.size());
187
188   for (unsigned int i=0; i<results.size();i++){
189     caml_initialize(&Field(resarray,i),Val_int(results[i]));
190   };
191   CAMLreturn (resarray);  
192 }
193
194
195 extern "C" CAMLprim value caml_xml_tree_root(value tree){
196   CAMLparam1(tree);
197   CAMLreturn (TREENODEVAL(XMLTREE(tree)->Root()));
198 }
199 extern "C" CAMLprim value caml_xml_tree_text_collection(value tree){
200   CAMLparam1(tree);
201   CAMLreturn((value) XMLTREE(tree)->getTextCollection());
202 }
203 extern "C" CAMLprim value caml_xml_tree_parent(value tree, value id){
204   CAMLparam2(tree,id);
205   CAMLreturn(Val_int (XMLTREE(tree)->Parent(TREENODEVAL(id))));
206 }
207 extern "C" CAMLprim value caml_xml_tree_parent_doc(value tree, value id){
208   CAMLparam2(tree,id);
209   CAMLreturn(Val_int (XMLTREE(tree)->ParentNode((DocID) Int_val(id))));
210 }
211
212 extern "C" CAMLprim value caml_xml_tree_is_ancestor(value tree,value id1, value id2) {
213   CAMLparam3(tree,id1,id2);
214   CAMLreturn(Val_bool (XMLTREE(tree)->IsAncestor(TREENODEVAL(id1),TREENODEVAL(id2))));
215 }
216
217 extern "C" CAMLprim value caml_xml_tree_serialize(value tree, value filename){
218   CAMLparam2(tree,filename);
219   NOT_IMPLEMENTED("caml_xml_tree_serialize");
220   CAMLreturn(Val_unit);
221 }
222
223 extern "C" CAMLprim value caml_xml_tree_unserialize(value filename){
224   CAMLparam1(filename);
225   NOT_IMPLEMENTED("caml_xml_tree_unserialize");
226   CAMLreturn(Val_unit);
227 }
228
229
230 extern "C" CAMLprim value caml_xml_tree_first_child(value tree, value id){
231   CAMLparam2(tree,id);
232   CAMLreturn(Val_int (XMLTREE(tree)->FirstChild(TREENODEVAL(id))));
233 }
234
235 extern "C" CAMLprim value caml_xml_tree_is_leaf(value tree, value id){
236   CAMLparam2(tree,id);
237   CAMLreturn(Val_bool (XMLTREE(tree)->IsLeaf(TREENODEVAL(id))));
238 }
239
240 extern "C" CAMLprim value caml_xml_tree_tagged_desc(value tree, value id, value tag){
241   CAMLparam3(tree,id,tag);
242   CAMLreturn(Val_int (XMLTREE(tree)->TaggedDesc(TREENODEVAL(id),(TagType) Int_val(tag))));
243 }
244
245 extern "C" CAMLprim value caml_xml_tree_tagged_next(value tree, value id, value tag){
246   CAMLparam3(tree,id,tag);
247   CAMLreturn(Val_int (XMLTREE(tree)->TaggedNext(TREENODEVAL(id),(TagType) Int_val(tag))));
248 }
249
250
251
252
253 extern "C" CAMLprim value caml_xml_tree_tagged_foll(value tree, value id, value tag){
254   CAMLparam3(tree,id,tag);
255   CAMLreturn(Val_int (XMLTREE(tree)->TaggedFoll(TREENODEVAL(id),(TagType) Int_val(tag))));
256 }
257
258
259 extern "C" CAMLprim value caml_xml_tree_next_sibling(value tree, value id){
260   CAMLparam2(tree,id);
261   CAMLreturn(Val_int (XMLTREE(tree)->NextSibling(TREENODEVAL(id))));
262 }
263
264 extern "C" CAMLprim value caml_xml_tree_prev_text(value tree, value id){
265   CAMLparam2(tree,id);
266   CAMLlocal1(res);
267   CAMLreturn(Val_int((XMLTREE(tree)->PrevText(TREENODEVAL(id)))));
268   CAMLreturn(res);
269 }
270 extern "C" CAMLprim value caml_xml_tree_next_text(value tree, value id){
271   CAMLparam2(tree,id);
272   CAMLreturn(Val_int((XMLTREE(tree)->NextText(TREENODEVAL(id)))));
273 }
274 extern "C" CAMLprim value caml_xml_tree_my_text(value tree, value id){
275   CAMLparam2(tree,id);
276   CAMLreturn(Val_int((XMLTREE(tree)->MyText(TREENODEVAL(id)))));
277 }
278
279 extern "C" CAMLprim value caml_xml_tree_text_xml_id(value tree, value id){
280   CAMLparam2(tree,id);
281   CAMLreturn(Val_int((XMLTREE(tree)->TextXMLId(TREENODEVAL(id)))));
282 }
283 extern "C" CAMLprim value caml_xml_tree_node_xml_id(value tree, value id){
284   CAMLparam2(tree,id);
285   CAMLreturn(Val_int((XMLTREE(tree)->NodeXMLId(TREENODEVAL(id)))));
286 }
287
288 extern "C" CAMLprim value caml_xml_tree_tag_name(value tree, value tagid){
289   CAMLparam2(tree,tagid);
290   CAMLlocal1(str);
291   char* tag;
292   tag = (char*) XMLTREE(tree)->GetTagNameByRef((TagType) (Int_val(tagid)));
293   str = caml_copy_string((const char*) tag);
294   CAMLreturn (str);
295 }
296
297
298 extern "C" CAMLprim value caml_xml_tree_tag_id(value tree,value id){
299   CAMLparam2(tree,id);  
300   CAMLreturn (Val_int(XMLTREE(tree)->Tag(TREENODEVAL(id))));
301 }
302
303 extern "C" CAMLprim value caml_xml_tree_subtree_tags(value tree,value id,value tag){
304   CAMLparam3(tree,id,tag);  
305   CAMLreturn (Val_int(XMLTREE(tree)->SubtreeTags(TREENODEVAL(id),Int_val(tag))));
306 }
307
308
309 extern "C" CAMLprim value caml_xml_tree_register_tag(value tree,value str){
310   CAMLparam2(tree,str);
311   CAMLlocal1(id);
312   unsigned char* tag;
313   tag = (unsigned char*) (String_val(str));
314   id = Val_int(XMLTREE(tree)->RegisterTag(tag));
315   CAMLreturn (id);
316 }
317
318 extern "C" CAMLprim value caml_xml_tree_nullt(value unit){
319   CAMLparam1(unit);
320   CAMLreturn (NULLT);
321 }
322
323 extern "C" CAMLprim value caml_xml_tree_save(value tree,value filename){
324   CAMLparam2(tree,filename);
325   XMLTREE(tree)->Save((unsigned char *) String_val(filename));
326   CAMLreturn (Val_unit);
327 }
328
329 extern "C" CAMLprim value caml_xml_tree_load(value filename,value samplerate){
330   CAMLparam2(filename,samplerate);
331   CAMLlocal1(doc);
332   XMLTree * tree;
333   tree = XMLTree::Load((unsigned char *) String_val(filename),Int_val(samplerate));
334   caml_init_ops();
335   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
336   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
337   CAMLreturn(doc);
338 }