c2265b2d7430f1ee5b4b4cbcc6971e04acdbee10
[SXSI/xpathcomp.git] / src / nodeSet.ml
1 INCLUDE "debug.ml"
2 INCLUDE "utils.ml"
3
4
5 module type S =
6   sig
7     type t
8     type elt = Tree.node
9     val empty : t
10     val var : (int*State.t) -> t
11     val close : ((int*State.t), t) Hashtbl.t -> t -> t
12     val is_open : t -> bool
13     val singleton : elt -> t
14     val cons : elt -> t -> t
15     val snoc : t -> elt -> t
16     val concat : t -> t -> t
17     val concat3 : t -> t -> t -> t
18     val concat4 : t -> t -> t -> t -> t
19     val conscat : elt -> t -> t -> t
20     val conscat3 : elt -> t -> t -> t -> t
21     val conscat4 : elt -> t -> t -> t -> t -> t
22     val subtree_tags : Tree.t -> elt -> Tag.t -> t
23     val subtree_elements : Tree.t -> elt -> t
24     val iter : ( elt -> unit) -> t -> unit
25     val fold : ( elt -> 'a -> 'a) -> t -> 'a -> 'a
26     val length : t -> int
27     val serialize : string -> Tree.t -> t -> unit
28
29   end
30
31 module Count : S with type t = int =
32   struct
33     type t = int
34     type elt = Tree.node
35
36     let empty = 0
37     let var _ = empty
38     let is_open _ = false
39     let close _ x = x
40     let singleton _ = 1
41     let cons _ x = x+1
42     let snoc x _ = x+1
43     let concat x y = x + y
44     let concat3 x y z = x + y + z
45     let concat4 x y z t = x + y + z + t
46     let conscat _ x y = 1 + x + y
47     let conscat3 _ x y z = 1 + x + y + z
48     let conscat4 _ x y z t = 1 + x + y + z + t
49     let subtree_tags tree node tag = Tree.subtree_tags tree node tag
50     let subtree_elements tree node = Tree.subtree_elements tree node
51     let iter _ _ = failwith "iter not implemented"
52     let fold _ _ _ = failwith "fold not implemented"
53     let map _ _ = failwith "map not implemented"
54     let length x = x
55     let serialize f _ x =
56       let o = open_out f in
57       output_string o "<xml_result>\n";
58       output_string o (string_of_int x);
59       output_string o "\n</xml_result>\n";
60       close_out o
61   end
62
63 type  clist =
64   | Nil
65   | Cons of Tree.node * clist
66   | Concat of clist * clist
67   | ConsCat of Tree.node * clist * clist
68   | SubtreeTags of Tree.t * Tree.node * Tag.t
69   | SubtreeElts of Tree.t * Tree.node
70
71
72 type 'a mat = { mutable clist : clist;
73                 mutable length : int }
74
75 module Mat : S with type t = Tree.node mat =
76   struct
77     type t = Tree.node mat
78     type elt = Tree.node
79     let is_open _ = false
80     let empty = { clist = Nil; length = 0 }
81     let singleton e = { clist = Cons(e, Nil) ; length = 1 }
82     let cons e l = { clist = Cons(e, l.clist); length = l.length + 1 }
83     let concat l1 l2 =
84       let ll1 = l1.length in
85       if ll1 == 0 then l2 else
86         let ll2 = l2.length in if ll2 == 0 then l1 else
87             { clist = Concat(l1.clist, l2.clist); length = ll1 + ll2 }
88
89     let snoc l e = concat l (singleton e)
90     let concat3 l1 l2 l3 = concat l1 (concat l2 l3)
91     let concat4 l1 l2 l3 l4 = concat (concat l1 l2) (concat l3 l4)
92     let var _ = empty
93     let close _ x = x
94
95
96     let conscat e l1 l2 =
97       let ll1 = l1.length in
98       if ll1 == 0 then cons e l2 else
99         let ll2 = l2.length in if ll2 == 0 then cons e l1 else
100             { clist = ConsCat(e, l1.clist, l2.clist); length = 1 + ll1 + ll2 }
101
102 (*    let conscat e l1 l2 = cons e (concat l1 l2) *)
103
104     let conscat3 e l1 l2 l3 = conscat e l1 (concat l2 l3)
105     let conscat4 e l1 l2 l3 l4 = conscat e l1 (concat l2 (concat l3 l4))
106
107     let subtree_tags tree node tag =
108       let len = Tree.subtree_tags tree node tag in
109       if len == 0 then empty
110       else
111         { clist = SubtreeTags(tree, node, tag);
112           length = len }
113
114     let subtree_elements tree node =
115       let len = Tree.subtree_elements tree node in
116       if len == 0 then empty
117       else
118         { clist = SubtreeElts(tree, node);
119           length = len }
120
121     let fst_tagged tree t tag =
122       if Tree.tag tree t == tag then t
123       else Tree.tagged_descendant tree t tag
124
125 (*
126   let fst_element tree t =
127       let tag = Tree.tag tree t in
128       if tag == Tag.document_node then
129         Tree.first_element tree t
130       else t
131 *)
132
133     let element_fold f tree t acc =
134       let rec loop node acc =
135         if node == Tree.nil then acc
136         else
137           let acc = f node acc in
138           let acc' = loop (Tree.first_element tree node) acc in
139             loop (Tree.next_element tree node) acc'
140       in
141       let t' = Tree.first_element tree t in loop t' acc
142
143     let element_iter f tree t =
144       let newf = fun e () -> f e in
145       element_fold newf tree t ()
146
147     let tag_fold f tree t tag acc =
148       let rec loop close node acc =
149         if node > Tree.nil && node < close then acc
150         else
151           let acc = f node acc in
152           loop close (Tree.tagged_next tree node tag) acc
153       in
154       let t' = fst_tagged tree t tag in
155         loop (Tree.closing tree t) t' acc
156
157     let tag_iter f tree t tag =
158       let rec loop close node =
159         if node > Tree.nil && node < close then begin
160           f node;
161           loop close (Tree.tagged_next tree node tag);
162         end
163       in
164       let t' = fst_tagged tree t tag in
165         loop (Tree.closing tree t) t'
166
167     let fold f l acc =
168       let rec loop l acc =
169         match l with
170           | Nil -> acc
171           | Cons(e, ll) -> loop ll (f e acc)
172           | Concat(l1, l2) -> loop l2 (loop l1 acc)
173           | ConsCat(e, l1, l2) -> loop l2 (loop l1 (f e acc))
174           | SubtreeTags(tree, t, tag) -> tag_fold f tree t tag acc
175           | SubtreeElts(tree, t) -> element_fold f tree t acc
176       in
177         loop l.clist acc
178
179     let iter f l =
180       let rec loop l =
181         match l with
182           | Nil -> ()
183           | Cons(e, l) -> f e; loop l
184           | Concat(l1, l2) -> loop l1; loop l2
185           | ConsCat(e, l1, l2) -> f e; loop l1; loop l2
186           | SubtreeTags(tree, t, tag) -> tag_iter f tree t tag
187           | SubtreeElts(tree, t) ->
188               element_iter f tree t
189       in
190         loop l.clist
191
192     let length l = l.length
193
194     let serialize name v l =
195       let fd, finish =
196         if name = "-" then Unix.stdout, ignore
197         else
198           Unix.openfile name [ Unix.O_WRONLY; Unix.O_TRUNC; Unix.O_CREAT ] 0o666,
199           Unix.close
200       in
201       ignore (Unix.write fd "<xml_result>\n" 0 13);
202       if l.length > 0 then begin
203         iter (fun node -> Tree.print_xml v node fd) l;
204         Tree.flush v fd;
205       end;
206       ignore (Unix.write fd "</xml_result>\n" 0 14);
207       finish fd
208
209   end
210 let rec debug_clist =
211   function
212       Nil -> Printf.eprintf "Nil"
213     | Cons(e, clist) ->
214         Printf.eprintf "Cons(%i," (Obj.magic e);
215         debug_clist clist;
216         Printf.eprintf ")";
217     | Concat(clist1, clist2) ->
218             Printf.eprintf "Concat(";
219         debug_clist clist1;
220         Printf.eprintf ",";
221             debug_clist clist2;
222             Printf.eprintf ")";
223     | ConsCat(_, clist1, clist2) ->
224             Printf.eprintf "Concat(";
225         debug_clist clist1;
226         Printf.eprintf ",";
227             debug_clist clist2;
228             Printf.eprintf ")";
229
230     | SubtreeTags(tree, node, tag) ->
231         Printf.eprintf "SubtreeTags(tree, %i, %s)"
232           (Obj.magic node)
233           (Tag.to_string tag);
234     | SubtreeElts(tree, node) ->
235         Printf.eprintf "SubtreeElts(tree, %i)"
236           (Obj.magic node)
237
238 let debug l = debug_clist l.clist
239
240
241
242 module Partial(N : S) : S =
243 struct
244
245   type elt = Tree.node
246   type t = { env : ((int*State.t), t) Hashtbl.t;
247              elem : list;
248              opened : bool;
249            }
250   and list =
251     | Var of (int * State.t)
252     | Nil
253     | Cons of elt * list
254     | Concat of list * list
255     | Lambda of t
256
257   let dummy = Hashtbl.create 0
258   let empty = { env = dummy;
259                 elem = Nil;
260                 opened = false }
261   let is_open t = t.opened
262
263
264   let close h t =
265     {empty with elem =
266         Lambda { t with env = h; opened = false } }
267
268   let singleton i = { empty with elem = Cons(i, Nil) }
269   let cons e t = { t with elem = Cons(e, t.elem) }
270   let concat t1 t2 =
271     { t1 with elem = Concat (t1.elem, t2.elem) }
272
273   let snoc t e = concat t (singleton e)
274   let concat3 t1 t2 t3 = concat t1 (concat t2 t3)
275   let concat4 t1 t2 t3 t4 = concat (concat t1 t2) (concat t3 t4)
276   let conscat e t1 t2 = cons e (concat t1 t2)
277   let conscat3 e t1 t2 t3 = cons e (concat3 t1 t2 t3)
278   let conscat4 e t1 t2 t3 t4 = cons e (concat4 t1 t2 t3 t4)
279   let subtree_tags _ = failwith "not implemented"
280   let subtree_elements _ = failwith "not_implemented"
281
282   let iter f t =
283     let rec loop t =
284       loop_list t.env t.elem
285     and loop_list h = function
286       | Nil -> ()
287       | Var i -> loop (Hashtbl.find h i)
288       | Cons (e, l) -> f e; loop_list h l
289       | Concat (l1, l2) -> loop_list h l1; loop_list h l2
290       | Lambda t -> loop t
291     in
292     loop t
293
294   let fold f t acc =
295     let rec loop t acc =
296       loop_list t.env acc t.elem
297     and loop_list h acc = function
298       | Nil -> acc
299       | Var i -> loop (try Hashtbl.find h i with Not_found -> let a,b = i in Printf.eprintf "%i,%i not found\n%!" a b; empty) acc
300       | Cons (e, l) ->   loop_list h (f e acc) l
301       | Concat (l1, l2) -> loop_list h (loop_list h acc l1) l2
302       | Lambda t -> loop t acc
303     in
304     loop t acc
305
306
307   let rec dump t =
308     Hashtbl.iter (fun (i,j) t ->
309       Format.eprintf "%i, %a ->" i State.print j;
310       dump t;
311       Format.eprintf "----------------\n%!";
312     ) t.env;
313     dump_list t.elem
314   and dump_list  = function
315     | Nil -> ()
316     | Var (i,j) -> Format.eprintf "Var(%i, %a) " i State.print j;
317     | Cons (e, l) -> Format.eprintf "%i " (Node.to_int e); dump_list l
318     | Concat (l1, l2) -> dump_list l1 ; dump_list l2
319     | Lambda t -> dump t
320
321
322   let length t = fold (fun _ acc -> 1 + acc) t 0
323
324
325   let var i =
326     { empty with elem = Var i; opened = true }
327
328   let serialize _ = failwith "not implemented"
329 end