Some more bugfixing for the contains.
[SXSI/xpathcomp.git] / OCamlDriver.cpp
1 /**************************************
2  * OCamlDriver.cpp
3  * -------------------
4  * A Test Ocaml Driver which calls the C++ methods and
5  * adds a C wrapper interface with OCaml code.
6  * 
7  * Author: Kim Nguyen
8  * Date: 04/11/08
9  */
10
11 /* OCaml memory managment */
12 extern "C" {
13 #include <caml/mlvalues.h>
14 #include <caml/alloc.h>
15 #include <caml/memory.h>
16 #include <caml/callback.h>
17 #include <caml/fail.h>
18 #include <caml/custom.h>
19   
20
21 } //extern C
22
23 //#include "TextCollection/TextCollection.h"
24 #include "XMLDocShredder.h"
25 #include "XMLTree.h"
26 #include "Utils.h"
27
28 #define CAMLRAISECPP(e) (caml_failwith( ((e).what())))
29 #define NOT_IMPLEMENTED(s)  (caml_failwith(s))
30 #define XMLTREE(x) ((XMLTree *)(* (XMLTree**) Data_custom_val(x)))
31 #define TEXTCOLLECTION(x)
32 #define TREENODEVAL(i) ((treeNode) (Int_val(i)))
33
34 extern "C" {
35   static struct custom_operations ops;
36   static bool initialized = false;
37 }
38 extern "C" void caml_xml_tree_finalize(value tree){
39   delete XMLTREE(tree);
40   return;
41 }
42
43 extern "C" void caml_init_ops () {
44
45   if (initialized)
46     return; 
47   ops.identifier = (char*) "XMLTree";
48   ops.finalize = caml_xml_tree_finalize;
49   return;
50 }
51
52 extern "C" CAMLprim value caml_call_shredder_uri(value uri,value sf, value iet, value dtc){
53   CAMLparam1(uri);
54   CAMLlocal1(doc);
55   char *fn = String_val(uri);
56   try {
57     XMLDocShredder shredder(fn,Int_val(sf),Bool_val(iet),Bool_val(dtc));
58   XMLTree * tree;
59   shredder.processStartDocument(fn);  
60   shredder.parse();  
61   shredder.processEndDocument();
62   caml_init_ops();
63   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
64   tree = (XMLTree *) shredder.storageIfc_->returnDocument();
65   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
66   CAMLreturn(doc);
67   }
68   catch (const std::exception& e){
69     CAMLRAISECPP(e);
70   };
71   
72 }
73
74 extern "C" CAMLprim value caml_call_shredder_string(value data,value sf, value iet, value dtc){
75   CAMLparam1(data);
76   CAMLlocal1(doc);
77   unsigned int ln = string_length(data);
78   unsigned char *fn = (unsigned char*) String_val(data);
79   
80   try {
81     XMLDocShredder shredder(fn,ln,Int_val(sf),Bool_val(iet),Bool_val(dtc));  
82     XMLTree* tree;
83     shredder.processStartDocument("");  
84     shredder.parse();  
85     shredder.processEndDocument();
86     caml_init_ops();
87     doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
88     tree = (XMLTree *) shredder.storageIfc_->returnDocument();
89     memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
90     CAMLreturn(doc);
91   }
92   catch (const std::exception& e) {
93     CAMLRAISECPP(e);
94   };
95 }
96
97 void traversal_rec(XMLTree* tree, treeNode id){
98  DocID tid; 
99   if (id == NULLT)
100     return;
101   //  int tag = tree->Tag(id);
102    if (id) {
103         tid = tree->PrevText(id);
104         char * data = (char *) (tree->getTextCollection())->GetText(tid);
105         if (tree->IsLeaf(id)){
106           tid = tree->MyText(id);
107
108           data = (char*) (tree->getTextCollection())->GetText(tid);
109         };
110   
111         if (tree->NextSibling(id) == NULLT){
112           tid = tree->NextText(id);
113           data = (char*) (tree->getTextCollection())->GetText(tid);
114         }; 
115    };
116    traversal_rec(tree,tree->FirstChild(id));
117    traversal_rec(tree,tree->NextSibling(id));
118    return;
119 }
120
121 extern "C" CAMLprim value caml_cpp_traversal(value tree){
122   CAMLparam1(tree);
123   traversal_rec(XMLTREE(tree),XMLTREE(tree)->Root());
124   CAMLreturn(Val_unit);
125 }
126
127 extern "C" CAMLprim value caml_text_collection_get_text(value tree, value id){
128   CAMLparam2(tree,id);
129   CAMLlocal1(str);
130   uchar* txt = XMLTREE(tree)->GetText((DocID) Int_val(id));
131   str = caml_copy_string((const char*)txt);
132   delete (txt);
133   CAMLreturn (str);
134 }
135 extern "C" CAMLprim value caml_text_collection_empty_text(value tree,value id){
136   CAMLparam2(tree,id);
137   CAMLreturn ( Val_int((XMLTREE(tree))->EmptyText((DocID) Int_val(id))));
138 }
139
140 extern "C" CAMLprim value caml_text_collection_is_contains(value tree,value str){
141   CAMLparam2(tree,str);
142   uchar * cstr = (uchar *) String_val(str);  
143   CAMLreturn ( Val_bool((int) XMLTREE(tree)->IsContains(cstr)));
144 }
145
146 extern "C" CAMLprim value caml_text_collection_count_contains(value tree,value str){
147   CAMLparam2(tree,str);
148   uchar * cstr = (uchar *) String_val(str);  
149   CAMLreturn (Val_int((XMLTREE(tree)->CountContains(cstr))));
150   
151 }
152
153 extern "C" CAMLprim value caml_text_collection_contains(value tree,value str){
154   CAMLparam2(tree,str);
155   CAMLlocal1(resarray);
156   uchar * cstr = (uchar *) String_val(str);  
157   std::vector<DocID> results;
158   results = XMLTREE(tree)->Contains(cstr);
159   //free(cstr);
160   resarray = caml_alloc_tuple(results.size());
161
162   for (unsigned int i=0; i<results.size();i++){
163     caml_initialize(&Field(resarray,i),Val_int(results[i]));
164   };
165   CAMLreturn (resarray);  
166 }
167
168
169 extern "C" CAMLprim value caml_xml_tree_root(value tree){
170   CAMLparam1(tree);
171   CAMLreturn (TREENODEVAL(XMLTREE(tree)->Root()));
172 }
173 extern "C" CAMLprim value caml_xml_tree_text_collection(value tree){
174   CAMLparam1(tree);
175   CAMLreturn((value) XMLTREE(tree)->getTextCollection());
176 }
177 extern "C" CAMLprim value caml_xml_tree_parent(value tree, value id){
178   CAMLparam2(tree,id);
179   CAMLreturn(Val_int (XMLTREE(tree)->Parent(TREENODEVAL(id))));
180 }
181 extern "C" CAMLprim value caml_xml_tree_parent_doc(value tree, value id){
182   CAMLparam2(tree,id);
183   CAMLreturn(Val_int (XMLTREE(tree)->ParentNode((DocID) Int_val(id))));
184 }
185
186 extern "C" CAMLprim value caml_xml_tree_is_ancestor(value tree,value id1, value id2) {
187   CAMLparam3(tree,id1,id2);
188   CAMLreturn(Val_bool (XMLTREE(tree)->IsAncestor(TREENODEVAL(id1),TREENODEVAL(id2))));
189 }
190
191 extern "C" CAMLprim value caml_xml_tree_serialize(value tree, value filename){
192   CAMLparam2(tree,filename);
193   NOT_IMPLEMENTED("caml_xml_tree_serialize");
194   CAMLreturn(Val_unit);
195 }
196
197 extern "C" CAMLprim value caml_xml_tree_unserialize(value filename){
198   CAMLparam1(filename);
199   NOT_IMPLEMENTED("caml_xml_tree_unserialize");
200   CAMLreturn(Val_unit);
201 }
202
203
204 extern "C" CAMLprim value caml_xml_tree_first_child(value tree, value id){
205   CAMLparam2(tree,id);
206   CAMLreturn(Val_int (XMLTREE(tree)->FirstChild(TREENODEVAL(id))));
207 }
208
209 extern "C" CAMLprim value caml_xml_tree_is_leaf(value tree, value id){
210   CAMLparam2(tree,id);
211   CAMLreturn(Val_bool (XMLTREE(tree)->IsLeaf(TREENODEVAL(id))));
212 }
213
214 extern "C" CAMLprim value caml_xml_tree_next_sibling(value tree, value id){
215   CAMLparam2(tree,id);
216   CAMLreturn(Val_int (XMLTREE(tree)->NextSibling(TREENODEVAL(id))));
217 }
218
219 extern "C" CAMLprim value caml_xml_tree_prev_text(value tree, value id){
220   CAMLparam2(tree,id);
221   CAMLlocal1(res);
222   CAMLreturn(Val_int((XMLTREE(tree)->PrevText(TREENODEVAL(id)))));
223   CAMLreturn(res);
224 }
225 extern "C" CAMLprim value caml_xml_tree_next_text(value tree, value id){
226   CAMLparam2(tree,id);
227   CAMLreturn(Val_int((XMLTREE(tree)->NextText(TREENODEVAL(id)))));
228 }
229 extern "C" CAMLprim value caml_xml_tree_my_text(value tree, value id){
230   CAMLparam2(tree,id);
231   CAMLreturn(Val_int((XMLTREE(tree)->MyText(TREENODEVAL(id)))));
232 }
233
234 extern "C" CAMLprim value caml_xml_tree_text_xml_id(value tree, value id){
235   CAMLparam2(tree,id);
236   CAMLreturn(Val_int((XMLTREE(tree)->TextXMLId(TREENODEVAL(id)))));
237 }
238 extern "C" CAMLprim value caml_xml_tree_node_xml_id(value tree, value id){
239   CAMLparam2(tree,id);
240   CAMLreturn(Val_int((XMLTREE(tree)->NodeXMLId(TREENODEVAL(id)))));
241 }
242
243 extern "C" CAMLprim value caml_xml_tree_tag_name(value tree, value tagid){
244   CAMLparam2(tree,tagid);
245   CAMLlocal1(str);
246   char* tag;
247   tag = (char*) XMLTREE(tree)->GetTagNameByRef((TagType) (Int_val(tagid)));
248   str = caml_copy_string((const char*) tag);
249   CAMLreturn (str);
250 }
251
252
253 extern "C" CAMLprim value caml_xml_tree_tag_id(value tree,value id){
254   CAMLparam2(tree,id);  
255   CAMLreturn (Val_int(XMLTREE(tree)->Tag(TREENODEVAL(id))));
256 }
257
258 extern "C" CAMLprim value caml_xml_tree_register_tag(value tree,value str){
259   CAMLparam2(tree,str);
260   CAMLlocal1(id);
261   unsigned char* tag;
262   tag = (unsigned char*) (String_val(str));
263   id = Val_int(XMLTREE(tree)->RegisterTag(tag));
264   CAMLreturn (id);
265 }
266
267 extern "C" CAMLprim value caml_xml_tree_nullt(value unit){
268   CAMLparam1(unit);
269   CAMLreturn (NULLT);
270 }
271
272 extern "C" CAMLprim value caml_xml_tree_save(value tree,value filename){
273   CAMLparam2(tree,filename);
274   XMLTREE(tree)->Save((unsigned char *) String_val(filename));
275   CAMLreturn (Val_unit);
276 }
277
278 extern "C" CAMLprim value caml_xml_tree_load(value filename,value samplerate){
279   CAMLparam2(filename,samplerate);
280   CAMLlocal1(doc);
281   XMLTree * tree;
282   tree = XMLTree::Load((unsigned char *) String_val(filename),Int_val(samplerate));
283   caml_init_ops();
284   doc = caml_alloc_custom(&ops,sizeof(XMLTree*),1,2);
285   memcpy(Data_custom_val(doc),&tree,sizeof(XMLTree*));
286   CAMLreturn(doc);
287 }