Merged from branch stable-succint-refactor
[SXSI/xpathcomp.git] / OCamlDriver.cpp
1 /**************************************
2  * OCamlDriver.cpp
3  * -------------------
4  * A Test Ocaml Driver which calls the C++ methods and
5  * adds a C wrapper interface with OCaml code.
6  * 
7  * Author: Kim Nguyen
8  * Date: 04/11/08
9  */
10
11 /* OCaml memory managment */
12 extern "C" {
13 #include <caml/mlvalues.h>
14 #include <caml/alloc.h>
15 #include <caml/memory.h>
16 #include <caml/callback.h>
17 #include <caml/fail.h>
18 #include <caml/custom.h>
19   
20
21 } //extern C
22
23 //#include "TextCollection/TextCollection.h"
24 #include "XMLDocShredder.h"
25 #include "XMLTree.h"
26 #include "Utils.h"
27
28 #define CAMLRAISECPP(e) (caml_failwith( ((e).what())))
29 #define NOT_IMPLEMENTED(s)  (caml_failwith(s))
30 #define XMLTREE(x) ((XMLTree *)(* (XMLTree**) Data_custom_val(x)))
31 #define TEXTCOLLECTION(x)
32 #define TREENODEVAL(i) ((treeNode) (Int_val(i)))
33
34 extern "C" {
35   static struct custom_operations ops;
36   static bool initialized = false;
37 }
38 extern "C" void caml_xml_tree_finalize(value tree){
39   delete XMLTREE(tree);
40   return;
41 }
42
43 extern "C" void caml_init_ops () {
44
45   if (initialized)
46     return; 
47   ops.identifier = (char*) "XMLTree";
48   ops.finalize = caml_xml_tree_finalize;
49   return;
50 }
51
52 extern "C" CAMLprim value caml_call_shredder_uri(value uri,value sf, value iet, value dtc){
53   CAMLparam1(uri);
54   CAMLlocal1(doc);
55   char *fn = String_val(uri);
56   try {
57     XMLDocShredder shredder(fn,Int_val(sf),Bool_val(iet),Bool_val(dtc));
58   XMLTree * tree;
59   shredder.processStartDocument(fn);  
60   shredder.parse();  
61   shredder.processEndDocument();
62   caml_init_ops();
63   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
64   tree = (XMLTree *) shredder.storageIfc_->returnDocument();
65   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
66   CAMLreturn(doc);
67   }
68   catch (const std::exception& e){
69     CAMLRAISECPP(e);
70   };
71   
72 }
73
74 extern "C" CAMLprim value caml_call_shredder_string(value data,value sf, value iet, value dtc){
75   CAMLparam1(data);
76   CAMLlocal1(doc);
77   unsigned int ln = string_length(data);
78   unsigned char *fn = (unsigned char*) String_val(data);
79   
80   try {
81     XMLDocShredder shredder(fn,ln,Int_val(sf),Bool_val(iet),Bool_val(dtc));  
82     XMLTree* tree;
83     shredder.processStartDocument("");  
84     shredder.parse();  
85     shredder.processEndDocument();
86     caml_init_ops();
87     doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
88     tree = (XMLTree *) shredder.storageIfc_->returnDocument();
89     memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
90     CAMLreturn(doc);
91   }
92   catch (const std::exception& e) {
93     CAMLRAISECPP(e);
94   };
95 }
96
97 void traversal_rec(XMLTree* tree, treeNode id){
98  DocID tid; 
99   if (id == NULLT)
100     return;
101   //  int tag = tree->Tag(id);
102    if (id) {
103         tid = tree->PrevText(id);
104         char * data = (char *) (tree->getTextCollection())->GetText(tid);
105         if (tree->IsLeaf(id)){
106           tid = tree->MyText(id);
107
108           data = (char*) (tree->getTextCollection())->GetText(tid);
109         };
110   
111         if (tree->NextSibling(id) == NULLT){
112           tid = tree->NextText(id);
113           data = (char*) (tree->getTextCollection())->GetText(tid);
114         }; 
115    };
116    traversal_rec(tree,tree->FirstChild(id));
117    traversal_rec(tree,tree->NextSibling(id));
118    return;
119 }
120
121 extern "C" CAMLprim value caml_cpp_traversal(value tree){
122   CAMLparam1(tree);
123   traversal_rec(XMLTREE(tree),XMLTREE(tree)->Root());
124   CAMLreturn(Val_unit);
125 }
126
127 extern "C" CAMLprim value caml_text_collection_get_text(value tree, value id){
128   CAMLparam2(tree,id);
129   CAMLlocal1(str);
130   uchar* txt = XMLTREE(tree)->GetText((DocID) Int_val(id));
131   str = caml_copy_string((const char*)txt);
132   delete (txt);
133   CAMLreturn (str);
134 }
135 extern "C" CAMLprim value caml_text_collection_empty_text(value tree,value id){
136   CAMLparam2(tree,id);
137   CAMLreturn ( Val_int((XMLTREE(tree))->EmptyText((DocID) Int_val(id))));
138 }
139
140 extern "C" CAMLprim value caml_text_collection_is_contains(value tree,value str){
141   CAMLparam2(tree,str);
142   uchar * cstr = (uchar *) String_val(str);  
143   CAMLreturn ( Val_bool((int) XMLTREE(tree)->IsContains(cstr)));
144 }
145
146 extern "C" CAMLprim value caml_text_collection_count_contains(value tree,value str){
147   CAMLparam2(tree,str);
148   uchar * cstr = (uchar *) String_val(str);  
149   CAMLreturn (Val_int((XMLTREE(tree)->CountContains(cstr))));
150   
151 }
152
153 extern "C" CAMLprim value caml_text_collection_contains(value tree,value str){
154   CAMLparam2(tree,str);
155   CAMLlocal1(resarray);
156   uchar * cstr = (uchar *) String_val(str);  
157   std::vector<DocID> results;
158   results = XMLTREE(tree)->Contains(cstr);
159   //free(cstr);
160   resarray = caml_alloc_tuple(results.size());
161
162   for (unsigned int i=0; i<results.size();i++){
163     caml_initialize(&Field(resarray,i),Val_int(results[i]));
164   };
165   CAMLreturn (resarray);  
166 }
167
168
169 extern "C" CAMLprim value caml_xml_tree_root(value tree){
170   CAMLparam1(tree);
171   CAMLreturn (TREENODEVAL(XMLTREE(tree)->Root()));
172 }
173 extern "C" CAMLprim value caml_xml_tree_text_collection(value tree){
174   CAMLparam1(tree);
175   CAMLreturn((value) XMLTREE(tree)->getTextCollection());
176 }
177 extern "C" CAMLprim value caml_xml_tree_parent(value tree, value id){
178   CAMLparam2(tree,id);
179   CAMLreturn(Val_int (XMLTREE(tree)->Parent(TREENODEVAL(id))));
180 }
181 extern "C" CAMLprim value caml_xml_tree_parent_doc(value tree, value id){
182   CAMLparam2(tree,id);
183   CAMLreturn(Val_int (XMLTREE(tree)->ParentNode((DocID) Int_val(id))));
184 }
185
186 extern "C" CAMLprim value caml_xml_tree_is_ancestor(value tree,value id1, value id2) {
187   CAMLparam3(tree,id1,id2);
188   CAMLreturn(Val_bool (XMLTREE(tree)->IsAncestor(TREENODEVAL(id1),TREENODEVAL(id2))));
189 }
190
191 extern "C" CAMLprim value caml_xml_tree_serialize(value tree, value filename){
192   CAMLparam2(tree,filename);
193   NOT_IMPLEMENTED("caml_xml_tree_serialize");
194   CAMLreturn(Val_unit);
195 }
196
197 extern "C" CAMLprim value caml_xml_tree_unserialize(value filename){
198   CAMLparam1(filename);
199   NOT_IMPLEMENTED("caml_xml_tree_unserialize");
200   CAMLreturn(Val_unit);
201 }
202
203
204 extern "C" CAMLprim value caml_xml_tree_first_child(value tree, value id){
205   CAMLparam2(tree,id);
206   CAMLreturn(Val_int (XMLTREE(tree)->FirstChild(TREENODEVAL(id))));
207 }
208
209 extern "C" CAMLprim value caml_xml_tree_is_leaf(value tree, value id){
210   CAMLparam2(tree,id);
211   CAMLreturn(Val_bool (XMLTREE(tree)->IsLeaf(TREENODEVAL(id))));
212 }
213
214 extern "C" CAMLprim value caml_xml_tree_tagged_desc(value tree, value id, value tag){
215   CAMLparam3(tree,id,tag);
216   CAMLreturn(Val_int (XMLTREE(tree)->TaggedDesc(TREENODEVAL(id),(TagType) Int_val(tag))));
217 }
218
219 extern "C" CAMLprim value caml_xml_tree_tagged_next(value tree, value id, value tag){
220   CAMLparam3(tree,id,tag);
221   CAMLreturn(Val_int (XMLTREE(tree)->TaggedNext(TREENODEVAL(id),(TagType) Int_val(tag))));
222 }
223
224
225
226
227 extern "C" CAMLprim value caml_xml_tree_tagged_foll(value tree, value id, value tag){
228   CAMLparam3(tree,id,tag);
229   CAMLreturn(Val_int (XMLTREE(tree)->TaggedFoll(TREENODEVAL(id),(TagType) Int_val(tag))));
230 }
231
232
233 extern "C" CAMLprim value caml_xml_tree_next_sibling(value tree, value id){
234   CAMLparam2(tree,id);
235   CAMLreturn(Val_int (XMLTREE(tree)->NextSibling(TREENODEVAL(id))));
236 }
237
238 extern "C" CAMLprim value caml_xml_tree_prev_text(value tree, value id){
239   CAMLparam2(tree,id);
240   CAMLlocal1(res);
241   CAMLreturn(Val_int((XMLTREE(tree)->PrevText(TREENODEVAL(id)))));
242   CAMLreturn(res);
243 }
244 extern "C" CAMLprim value caml_xml_tree_next_text(value tree, value id){
245   CAMLparam2(tree,id);
246   CAMLreturn(Val_int((XMLTREE(tree)->NextText(TREENODEVAL(id)))));
247 }
248 extern "C" CAMLprim value caml_xml_tree_my_text(value tree, value id){
249   CAMLparam2(tree,id);
250   CAMLreturn(Val_int((XMLTREE(tree)->MyText(TREENODEVAL(id)))));
251 }
252
253 extern "C" CAMLprim value caml_xml_tree_text_xml_id(value tree, value id){
254   CAMLparam2(tree,id);
255   CAMLreturn(Val_int((XMLTREE(tree)->TextXMLId(TREENODEVAL(id)))));
256 }
257 extern "C" CAMLprim value caml_xml_tree_node_xml_id(value tree, value id){
258   CAMLparam2(tree,id);
259   CAMLreturn(Val_int((XMLTREE(tree)->NodeXMLId(TREENODEVAL(id)))));
260 }
261
262 extern "C" CAMLprim value caml_xml_tree_tag_name(value tree, value tagid){
263   CAMLparam2(tree,tagid);
264   CAMLlocal1(str);
265   char* tag;
266   tag = (char*) XMLTREE(tree)->GetTagNameByRef((TagType) (Int_val(tagid)));
267   str = caml_copy_string((const char*) tag);
268   CAMLreturn (str);
269 }
270
271
272 extern "C" CAMLprim value caml_xml_tree_tag_id(value tree,value id){
273   CAMLparam2(tree,id);  
274   CAMLreturn (Val_int(XMLTREE(tree)->Tag(TREENODEVAL(id))));
275 }
276
277 extern "C" CAMLprim value caml_xml_tree_subtree_tags(value tree,value id,value tag){
278   CAMLparam3(tree,id,tag);  
279   CAMLreturn (Val_int(XMLTREE(tree)->SubtreeTags(TREENODEVAL(id),Int_val(tag))));
280 }
281
282
283 extern "C" CAMLprim value caml_xml_tree_register_tag(value tree,value str){
284   CAMLparam2(tree,str);
285   CAMLlocal1(id);
286   unsigned char* tag;
287   tag = (unsigned char*) (String_val(str));
288   id = Val_int(XMLTREE(tree)->RegisterTag(tag));
289   CAMLreturn (id);
290 }
291
292 extern "C" CAMLprim value caml_xml_tree_nullt(value unit){
293   CAMLparam1(unit);
294   CAMLreturn (NULLT);
295 }
296
297 extern "C" CAMLprim value caml_xml_tree_save(value tree,value filename){
298   CAMLparam2(tree,filename);
299   XMLTREE(tree)->Save((unsigned char *) String_val(filename));
300   CAMLreturn (Val_unit);
301 }
302
303 extern "C" CAMLprim value caml_xml_tree_load(value filename,value samplerate){
304   CAMLparam2(filename,samplerate);
305   CAMLlocal1(doc);
306   XMLTree * tree;
307   tree = XMLTree::Load((unsigned char *) String_val(filename),Int_val(samplerate));
308   caml_init_ops();
309   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
310   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
311   CAMLreturn(doc);
312 }