09175ba1c3dff3d84f81c9b05d9345c4ae2248fa
[SXSI/xpathcomp.git] / OCamlDriver.cpp
1 /**************************************
2  * OCamlDriver.cpp
3  * -------------------
4  * A Test Ocaml Driver which calls the C++ methods and
5  * adds a C wrapper interface with OCaml code.
6  * 
7  * Author: Kim Nguyen
8  * Date: 04/11/08
9  */
10
11 /* OCaml memory managment */
12 extern "C" {
13 #include <caml/mlvalues.h>
14 #include <caml/alloc.h>
15 #include <caml/memory.h>
16 #include <caml/callback.h>
17 #include <caml/fail.h>
18 #include <caml/custom.h>
19   
20
21 } //extern C
22
23 //#include "TextCollection/TextCollection.h"
24 #include "XMLDocShredder.h"
25 #include "XMLTree.h"
26 #include "Utils.h"
27
28 #define CAMLRAISECPP(e) (caml_failwith( ((e).what())))
29 #define NOT_IMPLEMENTED(s)  (caml_failwith(s))
30 #define XMLTREE(x) ((XMLTree *)(* (XMLTree**) Data_custom_val(x)))
31 #define TEXTCOLLECTION(x)
32 #define TREENODEVAL(i) ((treeNode) (Int_val(i)))
33
34 extern "C" {
35   static struct custom_operations ops;
36   static bool initialized = false;
37 }
38 extern "C" void caml_xml_tree_finalize(value tree){
39   delete XMLTREE(tree);
40   return;
41 }
42
43 extern "C" void caml_init_ops () {
44
45   if (initialized)
46     return; 
47   ops.identifier = (char*) "XMLTree";
48   ops.finalize = caml_xml_tree_finalize;
49   return;
50 }
51
52 extern "C" CAMLprim value caml_call_shredder_uri(value uri,value sf, value iet, value dtc){
53   CAMLparam1(uri);
54   CAMLlocal1(doc);
55   char *fn = String_val(uri);
56   try {
57     XMLDocShredder shredder(fn,Int_val(sf),Bool_val(iet),Bool_val(dtc));
58   XMLTree * tree;
59   shredder.processStartDocument(fn);  
60   shredder.parse();  
61   shredder.processEndDocument();
62   caml_init_ops();
63   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
64   tree = (XMLTree *) shredder.storageIfc_->returnDocument();
65   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
66   CAMLreturn(doc);
67   }
68   catch (const std::exception& e){
69     CAMLRAISECPP(e);
70   };
71   
72 }
73
74 extern "C" CAMLprim value caml_call_shredder_string(value data,value sf, value iet, value dtc){
75   CAMLparam1(data);
76   CAMLlocal1(doc);
77   unsigned int ln = string_length(data);
78   unsigned char *fn = (unsigned char*) String_val(data);
79   
80   try {
81     XMLDocShredder shredder(fn,ln,Int_val(sf),Bool_val(iet),Bool_val(dtc));  
82     XMLTree* tree;
83     shredder.processStartDocument("");  
84     shredder.parse();  
85     shredder.processEndDocument();
86     caml_init_ops();
87     doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
88     tree = (XMLTree *) shredder.storageIfc_->returnDocument();
89     memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
90     CAMLreturn(doc);
91   }
92   catch (const std::exception& e) {
93     CAMLRAISECPP(e);
94   };
95 }
96
97 void traversal_rec(XMLTree* tree, treeNode id){
98  DocID tid; 
99   if (id == NULLT)
100     return;
101   //  int tag = tree->Tag(id);
102    if (id) {
103         tid = tree->PrevText(id);
104         char * data = (char *) (tree->getTextCollection())->GetText(tid);
105         if (tree->IsLeaf(id)){
106           tid = tree->MyText(id);
107
108           data = (char*) (tree->getTextCollection())->GetText(tid);
109         };
110   
111         if (tree->NextSibling(id) == NULLT){
112           tid = tree->NextText(id);
113           data = (char*) (tree->getTextCollection())->GetText(tid);
114         }; 
115    };
116    traversal_rec(tree,tree->FirstChild(id));
117    traversal_rec(tree,tree->NextSibling(id));
118    return;
119 }
120
121 extern "C" CAMLprim value caml_cpp_traversal(value tree){
122   CAMLparam1(tree);
123   traversal_rec(XMLTREE(tree),XMLTREE(tree)->Root());
124   CAMLreturn(Val_unit);
125 }
126
127 extern "C" CAMLprim value caml_text_collection_get_text(value tree, value id){
128   CAMLparam2(tree,id);
129   CAMLlocal1(str);
130   uchar* txt = XMLTREE(tree)->GetText((DocID) Int_val(id));
131   str = caml_copy_string((const char*)txt);
132   delete (txt);
133   CAMLreturn (str);
134 }
135
136 extern "C" CAMLprim value caml_text_collection_get_cached_text(value tree, value id){
137   CAMLparam2(tree,id);
138   CAMLlocal1(str);
139   const char* txt = (const char*) XMLTREE(tree)->GetCachedText((DocID) Int_val(id));
140   str = caml_copy_string(txt);
141   CAMLreturn (str);
142 }
143
144
145 extern "C" CAMLprim value caml_text_collection_empty_text(value tree,value id){
146   CAMLparam2(tree,id);
147   CAMLreturn ( Val_int((XMLTREE(tree))->EmptyText((DocID) Int_val(id))));
148 }
149
150 extern "C" CAMLprim value caml_text_collection_is_contains(value tree,value str){
151   CAMLparam2(tree,str);
152   uchar * cstr = (uchar *) String_val(str);  
153   CAMLreturn ( Val_bool((int) XMLTREE(tree)->IsContains(cstr)));
154 }
155
156 extern "C" CAMLprim value caml_text_collection_count_contains(value tree,value str){
157   CAMLparam2(tree,str);
158   uchar * cstr = (uchar *) String_val(str);  
159   CAMLreturn (Val_int((XMLTREE(tree)->CountContains(cstr))));
160   
161 }
162
163 extern "C" CAMLprim value caml_text_collection_contains(value tree,value str){
164   CAMLparam2(tree,str);
165   CAMLlocal1(resarray);
166   uchar * cstr = (uchar *) String_val(str);  
167   std::vector<DocID> results;
168   results = XMLTREE(tree)->Contains(cstr);
169   //free(cstr);
170   resarray = caml_alloc_tuple(results.size());
171
172   for (unsigned int i=0; i<results.size();i++){
173     caml_initialize(&Field(resarray,i),Val_int(results[i]));
174   };
175   CAMLreturn (resarray);  
176 }
177
178
179 extern "C" CAMLprim value caml_xml_tree_root(value tree){
180   CAMLparam1(tree);
181   CAMLreturn (TREENODEVAL(XMLTREE(tree)->Root()));
182 }
183 extern "C" CAMLprim value caml_xml_tree_text_collection(value tree){
184   CAMLparam1(tree);
185   CAMLreturn((value) XMLTREE(tree)->getTextCollection());
186 }
187 extern "C" CAMLprim value caml_xml_tree_parent(value tree, value id){
188   CAMLparam2(tree,id);
189   CAMLreturn(Val_int (XMLTREE(tree)->Parent(TREENODEVAL(id))));
190 }
191 extern "C" CAMLprim value caml_xml_tree_parent_doc(value tree, value id){
192   CAMLparam2(tree,id);
193   CAMLreturn(Val_int (XMLTREE(tree)->ParentNode((DocID) Int_val(id))));
194 }
195
196 extern "C" CAMLprim value caml_xml_tree_is_ancestor(value tree,value id1, value id2) {
197   CAMLparam3(tree,id1,id2);
198   CAMLreturn(Val_bool (XMLTREE(tree)->IsAncestor(TREENODEVAL(id1),TREENODEVAL(id2))));
199 }
200
201 extern "C" CAMLprim value caml_xml_tree_serialize(value tree, value filename){
202   CAMLparam2(tree,filename);
203   NOT_IMPLEMENTED("caml_xml_tree_serialize");
204   CAMLreturn(Val_unit);
205 }
206
207 extern "C" CAMLprim value caml_xml_tree_unserialize(value filename){
208   CAMLparam1(filename);
209   NOT_IMPLEMENTED("caml_xml_tree_unserialize");
210   CAMLreturn(Val_unit);
211 }
212
213
214 extern "C" CAMLprim value caml_xml_tree_first_child(value tree, value id){
215   CAMLparam2(tree,id);
216   CAMLreturn(Val_int (XMLTREE(tree)->FirstChild(TREENODEVAL(id))));
217 }
218
219 extern "C" CAMLprim value caml_xml_tree_is_leaf(value tree, value id){
220   CAMLparam2(tree,id);
221   CAMLreturn(Val_bool (XMLTREE(tree)->IsLeaf(TREENODEVAL(id))));
222 }
223
224 extern "C" CAMLprim value caml_xml_tree_tagged_desc(value tree, value id, value tag){
225   CAMLparam3(tree,id,tag);
226   CAMLreturn(Val_int (XMLTREE(tree)->TaggedDesc(TREENODEVAL(id),(TagType) Int_val(tag))));
227 }
228
229 extern "C" CAMLprim value caml_xml_tree_tagged_next(value tree, value id, value tag){
230   CAMLparam3(tree,id,tag);
231   CAMLreturn(Val_int (XMLTREE(tree)->TaggedNext(TREENODEVAL(id),(TagType) Int_val(tag))));
232 }
233
234
235
236
237 extern "C" CAMLprim value caml_xml_tree_tagged_foll(value tree, value id, value tag){
238   CAMLparam3(tree,id,tag);
239   CAMLreturn(Val_int (XMLTREE(tree)->TaggedFoll(TREENODEVAL(id),(TagType) Int_val(tag))));
240 }
241
242
243 extern "C" CAMLprim value caml_xml_tree_next_sibling(value tree, value id){
244   CAMLparam2(tree,id);
245   CAMLreturn(Val_int (XMLTREE(tree)->NextSibling(TREENODEVAL(id))));
246 }
247
248 extern "C" CAMLprim value caml_xml_tree_prev_text(value tree, value id){
249   CAMLparam2(tree,id);
250   CAMLlocal1(res);
251   CAMLreturn(Val_int((XMLTREE(tree)->PrevText(TREENODEVAL(id)))));
252   CAMLreturn(res);
253 }
254 extern "C" CAMLprim value caml_xml_tree_next_text(value tree, value id){
255   CAMLparam2(tree,id);
256   CAMLreturn(Val_int((XMLTREE(tree)->NextText(TREENODEVAL(id)))));
257 }
258 extern "C" CAMLprim value caml_xml_tree_my_text(value tree, value id){
259   CAMLparam2(tree,id);
260   CAMLreturn(Val_int((XMLTREE(tree)->MyText(TREENODEVAL(id)))));
261 }
262
263 extern "C" CAMLprim value caml_xml_tree_text_xml_id(value tree, value id){
264   CAMLparam2(tree,id);
265   CAMLreturn(Val_int((XMLTREE(tree)->TextXMLId(TREENODEVAL(id)))));
266 }
267 extern "C" CAMLprim value caml_xml_tree_node_xml_id(value tree, value id){
268   CAMLparam2(tree,id);
269   CAMLreturn(Val_int((XMLTREE(tree)->NodeXMLId(TREENODEVAL(id)))));
270 }
271
272 extern "C" CAMLprim value caml_xml_tree_tag_name(value tree, value tagid){
273   CAMLparam2(tree,tagid);
274   CAMLlocal1(str);
275   char* tag;
276   tag = (char*) XMLTREE(tree)->GetTagNameByRef((TagType) (Int_val(tagid)));
277   str = caml_copy_string((const char*) tag);
278   CAMLreturn (str);
279 }
280
281
282 extern "C" CAMLprim value caml_xml_tree_tag_id(value tree,value id){
283   CAMLparam2(tree,id);  
284   CAMLreturn (Val_int(XMLTREE(tree)->Tag(TREENODEVAL(id))));
285 }
286
287 extern "C" CAMLprim value caml_xml_tree_subtree_tags(value tree,value id,value tag){
288   CAMLparam3(tree,id,tag);  
289   CAMLreturn (Val_int(XMLTREE(tree)->SubtreeTags(TREENODEVAL(id),Int_val(tag))));
290 }
291
292
293 extern "C" CAMLprim value caml_xml_tree_register_tag(value tree,value str){
294   CAMLparam2(tree,str);
295   CAMLlocal1(id);
296   unsigned char* tag;
297   tag = (unsigned char*) (String_val(str));
298   id = Val_int(XMLTREE(tree)->RegisterTag(tag));
299   CAMLreturn (id);
300 }
301
302 extern "C" CAMLprim value caml_xml_tree_nullt(value unit){
303   CAMLparam1(unit);
304   CAMLreturn (NULLT);
305 }
306
307 extern "C" CAMLprim value caml_xml_tree_save(value tree,value filename){
308   CAMLparam2(tree,filename);
309   XMLTREE(tree)->Save((unsigned char *) String_val(filename));
310   CAMLreturn (Val_unit);
311 }
312
313 extern "C" CAMLprim value caml_xml_tree_load(value filename,value samplerate){
314   CAMLparam2(filename,samplerate);
315   CAMLlocal1(doc);
316   XMLTree * tree;
317   tree = XMLTree::Load((unsigned char *) String_val(filename),Int_val(samplerate));
318   caml_init_ops();
319   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
320   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
321   CAMLreturn(doc);
322 }