Fixed caching bugs in ata.ml
[SXSI/xpathcomp.git] / ata.ml
1 INCLUDE "debug.ml"
2 INCLUDE "utils.ml"
3
4 type jump_kind = [ `TAG of Tag.t | `CONTAINS of string | `NOTHING ]
5
6 (* Todo : move elsewhere *)
7 external vb : bool -> int = "%identity"
8
9 module State : 
10 sig 
11   include Sigs.T with type t = int 
12   val make : unit -> t 
13 end =
14 struct
15   type t = int
16   let make = 
17     let id = ref (-1) in
18       fun () -> incr id;!id
19   let compare = (-)
20   let equal = (==)
21   external hash : t -> int =  "%identity"
22   let print fmt x = Format.fprintf fmt "%i" x
23   let dump fmt x = print fmt x
24   let check x = 
25     if x < 0 then failwith (Printf.sprintf "State: Assertion %i < 0 failed" x)
26 end
27
28 module StateSet = Ptset.Int
29   
30 module Formula =
31 struct
32     type 'hcons expr = 
33       | False | True
34       | Or of 'hcons * 'hcons
35       | And of 'hcons * 'hcons
36       | Atom of ([ `Left | `Right  | `LLeft | `RRight  ]*bool*State.t)
37
38     type 'hcons node = {
39       pos : 'hcons expr;
40       mutable neg : 'hcons;
41       st : (StateSet.t*StateSet.t*StateSet.t)*(StateSet.t*StateSet.t*StateSet.t);
42       size: int; (* Todo check if this is needed *)
43     }
44         
45     external hash_const_variant : [> ] -> int = "%identity" 
46     module rec Node : Hcons.S with type data = Data.t = Hcons.Make (Data)
47     and Data : Hashtbl.HashedType  with type t = Node.t node =
48     struct 
49     type t =  Node.t node
50     let equal x y = x.size == y.size &&
51       match x.pos,y.pos with
52         | a,b when a == b -> true
53         | Or(xf1,xf2),Or(yf1,yf2) 
54         | And(xf1,xf2),And(yf1,yf2)  -> (xf1 == yf1) && (xf2 == yf2)
55         | Atom(d1,p1,s1), Atom(d2,p2,s2) -> d1 == d2 && (p1==p2) && s1 == s2
56         | _ -> false
57     let hash f = 
58       match f.pos with
59         | False -> 0
60         | True -> 1
61         | Or (f1,f2) -> HASHINT3(PRIME2,f1.Node.id, f2.Node.id)
62         | And (f1,f2) -> HASHINT3(PRIME3,f1.Node.id,f2.Node.id)
63         | Atom(d,p,s) -> HASHINT4(PRIME4,hash_const_variant d,vb p,s)       
64     end
65
66     type t = Node.t
67     let hash x = x.Node.key
68     let uid x = x.Node.id
69     let equal = Node.equal 
70     let expr f = f.Node.node.pos 
71     let st f = f.Node.node.st
72     let size f = f.Node.node.size
73       
74     let prio f = 
75       match expr f with
76         | True | False -> 10
77         | Atom _ -> 8
78         | And _ -> 6
79         | Or _ -> 1
80
81     let rec print ?(parent=false) ppf f =
82       if parent then Format.fprintf ppf "(";
83       let _ = match expr f with
84         | True -> Format.fprintf ppf "T"
85         | False -> Format.fprintf ppf "F"
86         | And(f1,f2) -> 
87             print ~parent:(prio f > prio f1) ppf f1;
88             Format.fprintf ppf " ∧ ";
89             print ~parent:(prio f > prio f2) ppf f2;
90         | Or(f1,f2) -> 
91             (print ppf f1);
92             Format.fprintf ppf " ∨ ";
93             (print ppf f2);
94         | Atom(dir,b,s) -> Format.fprintf ppf "%s%s[%i]"
95             (if b then "" else "¬")
96               (match  dir with 
97                  | `Left ->  "↓₁" 
98                  | `Right -> "↓₂"
99                  | `LLeft ->  "⇓₁" 
100                  | `RRight -> "⇓₂") s
101       in
102         if parent then Format.fprintf ppf ")"
103           
104     let print ppf f =  print ~parent:false ppf f
105       
106     let is_true f = (expr f) == True
107     let is_false f = (expr f) == False
108
109
110     let cons pos neg s1 s2 size1 size2 =
111       let nnode = Node.make { pos = neg; neg = (Obj.magic 0); st = s2; size = size2 } in
112       let pnode = Node.make { pos = pos; neg = nnode ; st = s1; size = size1 }
113       in 
114         (Node.node nnode).neg <- pnode; (* works because the neg field isn't taken into
115                                             account for hashing ! *)
116         pnode,nnode
117
118     let empty_triple = StateSet.empty,StateSet.empty,StateSet.empty
119     let empty_hex = empty_triple,empty_triple
120     let true_,false_ = cons True False empty_hex empty_hex 0 0
121     let atom_ d p s = 
122       let si = StateSet.singleton s in
123       let ss = match d with
124         | `Left -> (si,StateSet.empty,si),empty_triple
125         | `Right -> empty_triple,(si,StateSet.empty,si)
126         | `LLeft -> (StateSet.empty,si,si),empty_triple
127         | `RRight -> empty_triple,(StateSet.empty,si,si)
128       in fst (cons (Atom(d,p,s)) (Atom(d,not p,s)) ss ss 1 1)
129
130     let not_ f = f.Node.node.neg
131     let union_hex  ((l1,ll1,lll1),(r1,rr1,rrr1))  ((l2,ll2,lll2),(r2,rr2,rrr2)) =
132       (StateSet.mem_union l1 l2 ,StateSet.mem_union ll1 ll2,StateSet.mem_union lll1 lll2),
133       (StateSet.mem_union r1 r2 ,StateSet.mem_union rr1 rr2,StateSet.mem_union rrr1 rrr2)
134       
135     let merge_states f1 f2 =
136       let sp = 
137         union_hex (st f1) (st f2)
138       and sn = 
139         union_hex (st (not_ f1)) (st (not_ f2))
140       in
141         sp,sn
142
143     let order f1 f2 = if uid f1  < uid f2 then f2,f1 else f1,f2 
144
145     let or_ f1 f2 = 
146       (* Tautologies: x|x, x|not(x) *)
147
148       if equal f1 f2 then f1 else        
149       if equal f1 (not_ f2) then true_ else
150
151       (* simplification *)
152       if is_true f1 || is_true f2 then true_ else
153       if is_false f1 && is_false f2 then false_ else
154       if is_false f1 then f2 else
155       if is_false f2 then f1 else
156
157       (* commutativity of | *)
158       
159       let f1,f2 = order f1 f2 in
160       let psize = (size f1) + (size f2) in
161       let nsize = (size (not_ f1)) + (size (not_ f2)) in
162       let sp,sn = merge_states f1 f2 in
163       fst (cons (Or(f1,f2)) (And(not_ f1,not_ f2)) sp sn psize nsize)
164               
165                       
166     let and_ f1 f2 = 
167
168       (* Tautologies: x&x, x&not(x) *)
169
170       if equal f1 f2 then f1 else 
171       if equal f1 (not_ f2) then false_ else
172
173         (* simplifications *)
174
175       if is_true f1 && is_true f2 then true_ else
176       if is_false f1 || is_false f2 then false_ else
177       if is_true f1 then f2 else
178       if is_true f2 then f1 else
179       
180       (* commutativity of & *)
181
182       let f1,f2 = order f1 f2 in        
183       let psize = (size f1) + (size f2) in
184       let nsize = (size (not_ f1)) + (size (not_ f2)) in
185       let sp,sn = merge_states f1 f2 in
186         fst (cons (And(f1,f2)) (Or(not_ f1,not_ f2)) sp sn psize nsize)               
187     module Infix = struct
188     let ( +| ) f1 f2 = or_ f1 f2
189     let ( *& ) f1 f2 = and_ f1 f2
190     let ( *+ ) d s = atom_ d true s
191     let ( *- ) d s = atom_ d false s
192     end
193 end
194   
195 module Transition = struct
196   
197   type node = State.t*bool*Formula.t*bool
198   include Hcons.Make(struct
199                        type t = node
200                        let hash (s,m,f,b) = HASHINT4(s,Formula.uid f,vb m,vb b)
201                        let equal (s,b,f,m) (s',b',f',m') = 
202                          s == s' && b==b' && m==m' && Formula.equal f f' 
203                      end)
204     
205   let print ppf f = let (st,mark,form,b) = node f in
206     Format.fprintf ppf "%i %s" st (if mark then "⇒" else "→");
207     Formula.print ppf form;
208     Format.fprintf ppf "%s%!" (if b then " (b)" else "")
209
210
211   module Infix = struct
212   let ( ?< ) x = x
213   let ( >< ) state (l,mark) = state,(l,mark,false)
214   let ( ><@ ) state (l,mark) = state,(l,mark,true)
215   let ( >=> ) (state,(label,mark,bur)) form = (state,label,(make (state,mark,form,bur)))
216   end
217
218 end
219
220 module TransTable = Hashtbl
221  
222 module Formlist = struct 
223   include Hlist.Make(Transition)
224   let print ppf fl = 
225     iter (fun t -> Transition.print ppf t; Format.pp_print_newline ppf ()) fl
226 end
227
228 module Formlistlist = 
229 struct
230   include Hlist.Make(Formlist)
231   let print ppf fll =
232     iter (fun fl -> Formlist.print ppf fl; Format.pp_print_newline ppf ())fll
233 end
234   
235 type 'a t = { 
236     id : int;
237     mutable states : Ptset.Int.t;
238     init : Ptset.Int.t;
239     starstate : Ptset.Int.t option;
240     (* Transitions of the Alternating automaton *)
241     trans : (State.t,(TagSet.t*Transition.t) list) Hashtbl.t;
242     query_string: string;
243  }
244
245         
246 let dump ppf a = 
247   Format.fprintf ppf "Automaton (%i) :\n" a.id;
248   Format.fprintf ppf "States : "; StateSet.print ppf a.states;
249   Format.fprintf ppf "\nInitial states : "; StateSet.print ppf a.init;
250   Format.fprintf ppf "\nAlternating transitions :\n";
251   let l = Hashtbl.fold (fun k t acc -> 
252                           (List.map (fun (ts,tr) -> (ts,k),Transition.node tr) t) @ acc) a.trans [] in
253   let l = List.sort (fun ((tsx,x),_) ((tsy,y),_) -> 
254                        if y-x == 0 then TagSet.compare tsy tsx else y-x) l in
255   let maxh,maxt,l_print = 
256     List.fold_left (
257       fun (maxh,maxt,l) ((ts,q),(_,b,f,_)) ->                     
258         let s = 
259           if TagSet.is_finite ts 
260           then "{" ^ (TagSet.fold (fun t a -> a ^ " '" ^ (Tag.to_string t)^"'") ts "") ^" }"
261           else let cts = TagSet.neg ts in
262           if TagSet.is_empty cts then "*" else
263           (TagSet.fold (fun t a -> a ^ " " ^ (Tag.to_string t)) cts "*\\{"
264           )^ "}"
265         in
266         let s = Printf.sprintf "(%s,%i)" s q in
267         let s_frm =
268           Formula.print Format.str_formatter f;
269           Format.flush_str_formatter()     
270         in
271           (max (String.length s) maxh, max (String.length s_frm) maxt,
272            (s,(if b then "⇒" else "→"),s_frm)::l)) (0,0,[]) l
273   in
274     Format.fprintf ppf "%s\n%!" (String.make (maxt+maxh+3) '_');
275     List.iter (fun (s,m,f) -> let s = s ^ (String.make (maxh-(String.length s)) ' ') in
276                  Format.fprintf ppf "%s %s %s\n" s m f) l_print;
277     Format.fprintf ppf "%s\n%!" (String.make (maxt+maxh+3) '_')
278     
279
280 module FormTable = Hashtbl.Make(struct
281                                   type t = Formula.t*StateSet.t*StateSet.t
282                                   let equal (f1,s1,t1) (f2,s2,t2) =
283                                     f1 == f2 && s1 == s2 && t1 == t2
284                                   let hash (f,s,t) = 
285                                     HASHINT3(Formula.uid f ,StateSet.uid s,StateSet.uid t)
286                                 end)
287 module F = Formula
288
289 let eval_form_bool = 
290   let h_f = FormTable.create BIG_H_SIZE in
291     fun f s1 s2 ->
292       let rec loop f =
293         match F.expr f with
294           | F.True -> true,true,true
295           | F.False -> false,false,false
296           | F.Atom((`Left|`LLeft),b,q) ->
297               if b == (StateSet.mem q s1) 
298               then (true,true,false) 
299               else false,false,false
300           | F.Atom(_,b,q) -> 
301               if b == (StateSet.mem q s2) 
302               then (true,false,true)
303               else false,false,false    
304           | f' -> 
305               try FormTable.find h_f (f,s1,s2)
306               with Not_found -> let r =
307                 match f' with
308                   | F.Or(f1,f2) ->          
309                       let b1,rl1,rr1 = loop f1
310                       in
311                         if b1 && rl1 && rr1 then (true,true,true)  else
312                           let b2,rl2,rr2 = loop f2  in
313                           let rl1,rr1 = if b1 then rl1,rr1 else false,false
314                           and rl2,rr2 = if b2 then rl2,rr2 else false,false
315                           in (b1 || b2, rl1||rl2,rr1||rr2)
316                                
317                   | F.And(f1,f2) -> 
318                       let b1,rl1,rr1 = loop f1 in
319                         if b1 && rl1 && rr1 then (true,true,true) else
320                           if b1 then 
321                             let b2,rl2,rr2 = loop f2 in
322                               if b2 then (true,rl1||rl2,rr1||rr2) else (false,false,false)
323                           else (false,false,false)
324                   | _ -> assert false
325               in FormTable.add h_f (f,s1,s2) r;r
326       in loop f
327
328            
329 module FTable = Hashtbl.Make( struct
330                                 type t = Formlist.t*StateSet.t*StateSet.t
331                                 let equal (f1,s1,t1) (f2,s2,t2) =
332                                   f1 == f2 &&  s1 == s2 && t1 == t2;;
333                                 let hash (f,s,t) =  HASHINT3(Formlist.uid f ,StateSet.uid s,StateSet.uid t);;
334                               end)
335
336
337 let h_f = FTable.create BIG_H_SIZE 
338
339 let eval_formlist s1 s2 fl =
340   let rec loop fl =
341           try 
342             FTable.find h_f (fl,s1,s2)
343           with 
344             | Not_found  -> 
345                 match Formlist.node fl with
346                   | Formlist.Cons(f,fll) ->
347                       let q,mark,f,_ = Transition.node f in
348                       let b,b1,b2 = eval_form_bool f s1 s2 in
349                       let (s,(b',b1',b2',amark)) as res = loop fll in
350                       let r = if b then (StateSet.add q s, (b, b1'||b1,b2'||b2,mark||amark))
351                       else res
352                       in FTable.add h_f (fl,s1,s2) r;r
353                   | Formlist.Nil -> StateSet.empty,(false,false,false,false)
354   in loop fl
355               
356 let tags_of_state a q = 
357   Hashtbl.fold  
358     (fun p l acc -> 
359        if p == q then List.fold_left 
360          (fun acc (ts,t) -> 
361             let _,_,_,aux = Transition.node t in
362               if aux then acc else
363                 TagSet.cup ts acc) acc l
364          
365        else acc) a.trans TagSet.empty
366       
367       
368
369     let tags a qs = 
370       let ts = Ptset.Int.fold (fun q acc -> TagSet.cup acc (tags_of_state a q)) qs TagSet.empty
371       in
372         if TagSet.is_finite ts 
373         then `Positive(TagSet.positive ts)
374         else `Negative(TagSet.negative ts)
375         
376     let inter_text a b =
377       match b with
378         | `Positive s -> let r = Ptset.Int.inter a s in (r,Ptset.Int.mem Tag.pcdata r, true)
379         | `Negative s -> let r = Ptset.Int.diff a s in (r, Ptset.Int.mem Tag.pcdata r, false)
380       
381
382     module type ResultSet = 
383     sig
384       type t
385       type elt = [` Tree] Tree.node
386       val empty : t
387       val cons : elt -> t -> t
388       val concat : t -> t -> t
389       val iter : ( elt -> unit) -> t -> unit
390       val fold : ( elt -> 'a -> 'a) -> t -> 'a -> 'a
391       val map : ( elt -> elt) -> t -> t
392       val length : t -> int
393       val merge : (bool*bool*bool*bool) -> elt -> t -> t -> t 
394     end
395
396     module Integer : ResultSet =
397     struct
398       type t = int
399       type elt = [`Tree] Tree.node
400       let empty = 0
401       let cons _ x = x+1
402       let concat x y = x + y
403       let iter _ _ = failwith "iter not implemented"
404       let fold _ _ _ = failwith "fold not implemented"
405       let map _ _ = failwith "map not implemented"
406       let length x = x
407       let merge (rb,rb1,rb2,mark) t res1 res2 = 
408         if rb then
409           let res1 = if rb1 then res1 else 0
410           and res2 = if rb2 then res2 else 0
411           in
412             if mark then 1+res1+res2
413             else res1+res2
414         else 0
415     end
416
417     module IdSet : ResultSet = 
418     struct
419       type elt = [`Tree] Tree.node
420       type node = Nil 
421                   | Cons of elt * node 
422                   | Concat of node*node
423    
424       and t = { node : node;
425                 length :  int }
426
427       let empty = { node = Nil; length = 0 }
428         
429       let cons e t = { node = Cons(e,t.node); length = t.length+1 }
430       let concat t1 t2 = { node = Concat(t1.node,t2.node); length = t1.length+t2.length }
431       let append e t = { node = Concat(t.node,Cons(e,Nil)); length = t.length+1 } 
432         
433       let fold f l acc = 
434         let rec loop acc t = match t with
435           | Nil -> acc
436           | Cons (e,t) -> loop (f e acc) t
437           | Concat (t1,t2) -> loop (loop acc t1) t2
438         in
439           loop acc l.node
440             
441       let length l = l.length
442         
443         
444       let iter f l =
445         let rec loop = function
446           | Nil -> ()
447           | Cons (e,t) -> f e; loop t
448           | Concat(t1,t2) -> loop t1;loop t2
449         in loop l.node
450
451       let map f l =
452         let rec loop = function 
453           | Nil -> Nil
454           | Cons(e,t) -> Cons(f e, loop t)
455           | Concat(t1,t2) -> Concat(loop t1,loop t2)
456         in
457           { l with node = loop l.node }
458             
459       let merge (rb,rb1,rb2,mark) t res1 res2 = 
460         if rb then
461           let res1 = if rb1 then res1 else empty
462           and res2 = if rb2 then res2 else empty
463           in
464             if mark then { node = Cons(t,(Concat(res1.node,res2.node)));
465                            length = res1.length + res2.length + 1;}
466             else
467               { node = (Concat(res1.node,res2.node));
468                 length = res1.length + res2.length ;}
469         else empty        
470
471            
472     end
473     module GResult = struct
474       type t
475       type elt = [` Tree] Tree.node
476       external create_empty : int -> t = "caml_result_set_create"
477       external set : t -> int -> t = "caml_result_set_set"
478       external next : t -> int -> int = "caml_result_set_next"
479       external clear : t -> int -> int -> unit = "caml_result_set_clear"
480       let empty = create_empty 100000000
481         
482       let cons e t = set t (Obj.magic e)
483       let concat _ t = t
484       let iter f t =
485         let rec loop i = 
486           if i == -1 then ()
487           else (f (Obj.magic i);loop (next t i))
488         in loop 0
489           
490       let fold _ _ _ = failwith "noop"
491       let map _ _ = failwith "noop"
492       let length t = let cpt = ref ~-1 in
493       iter (fun _ -> incr cpt) t; !cpt
494       
495       let merge (rb,rb1,rb2,mark) elt t1 t2 =
496         if mark then (set t1 (Obj.magic elt) ; t1) else t1
497           
498     end
499     module Run (RS : ResultSet) =
500     struct
501
502       module SList = Hlist.Make (StateSet)
503
504
505
506 IFDEF DEBUG
507 THEN
508       module IntSet = Set.Make(struct type t = int let compare = (-) end)
509 INCLUDE "html_trace.ml"
510               
511 END             
512       let mk_fun f s = D_IGNORE_(register_funname f s,f)
513       let mk_app_fun f arg s = let g = f arg in 
514         D_IGNORE_(register_funname g ((get_funname f) ^ " " ^ s), g) 
515
516       let string_of_ts tags = (Ptset.Int.fold (fun t a -> a ^ " " ^ (Tag.to_string t) ) tags "{")^ " }"
517
518
519
520       module Algebra =
521         struct
522           type jump = [ `LONG | `CLOSE | `NIL ]
523           type t = jump*Ptset.Int.t
524               
525           let merge_jump (j1,l1) (j2,l2) = 
526             match j1,j2 with
527               | _ when j1 = j2 -> (j1,Ptset.Int.union l1 l2)
528               | _,`NIL -> j1,l1
529               | `NIL,_ -> j2,l2
530               | _,_ -> (`CLOSE, Ptset.Int.union l1 l2)
531
532           let merge_jump_list = function 
533             | [] -> `NIL,Ptset.Int.empty
534             | p::r -> List.fold_left (merge_jump) p r
535               
536           let labels a s = 
537             Hashtbl.fold 
538             (
539               fun q l acc -> 
540                 if (q == s)
541                 then 
542
543                   (List.fold_left 
544                       (fun acc (ts,f) ->
545                         let _,_,_,bur = Transition.node f in
546                         if bur then acc else TagSet.cup acc ts) 
547                     acc l)
548                 else acc ) a.trans TagSet.empty
549           exception Found
550             
551           let is_rec a s access = 
552             List.exists
553               (fun (_,t) -> let _,_,f,_ = Transition.node t in
554               StateSet.mem s (access f)) (Hashtbl.find a.trans s) 
555                      
556
557           let decide a c_label l_label dir_states access =
558                         
559             let l = StateSet.fold 
560               (fun s l -> 
561                  let s_rec= is_rec a s access in
562                  let tlabels,jmp = 
563                    if s_rec then l_label,`LONG 
564                    else c_label,`CLOSE in                             
565                  let slabels = TagSet.positive ((TagSet.cap (labels a s) tlabels))
566                  in
567                    (if Ptset.Int.is_empty slabels
568                     then `NIL,Ptset.Int.empty
569                     else  jmp,slabels)::l) dir_states []
570             in merge_jump_list l
571                  
572
573             
574             
575               
576         end 
577
578
579       let choose_jump tagset qtags1 qtagsn a f_nil  f_t1 f_s1 f_tn f_sn f_notext f_maytext =
580         let tags1,hastext1,fin1 = inter_text tagset (tags a qtags1) in
581         let tagsn,hastextn,finn = inter_text tagset (tags a qtagsn) in
582           (*if (hastext1||hastextn) then (`ANY,f_text)  (* jumping to text nodes doesn't work really well *)
583           else*)
584           if (Ptset.Int.is_empty tags1) && (Ptset.Int.is_empty tagsn) then (`NIL,f_nil)
585           else if (Ptset.Int.is_empty tagsn) then 
586             if (Ptset.Int.is_singleton tags1) 
587             then (* TaggedChild/Sibling *)
588               let tag = (Ptset.Int.choose tags1) in (`TAG(tag),mk_app_fun f_t1 tag (Tag.to_string tag))
589             else (* SelectChild/Sibling *)
590               (`ANY,mk_app_fun f_s1 tags1 (string_of_ts tags1))
591           else if (Ptset.Int.is_empty tags1) then 
592             if (Ptset.Int.is_singleton tagsn) 
593             then (* TaggedDesc/Following *)
594               let tag = (Ptset.Int.choose tagsn) in  (`TAG(tag),mk_app_fun f_tn tag (Tag.to_string tag))
595             else (* SelectDesc/Following *)
596               (`ANY,mk_app_fun f_sn tagsn (string_of_ts tagsn))
597           else if (hastext1||hastextn) then (`ANY,f_maytext)
598           else (`ANY,f_notext)
599           
600       let choose_jump_down tree a b c d = 
601         choose_jump a b c d
602           (mk_fun (fun _ -> Tree.nil) "Tree.mk_nil")
603           (mk_fun (Tree.tagged_child tree) "Tree.tagged_child") 
604           (mk_fun (Tree.select_child tree) "Tree.select_child")
605           (mk_fun (Tree.tagged_desc tree) "Tree.tagged_desc")
606           (mk_fun (Tree.select_desc tree) "Tree.select_desc") 
607           (mk_fun (Tree.first_element tree) "Tree.first_element")
608           (mk_fun (Tree.first_child tree) "Tree.first_child")
609
610       let choose_jump_next tree a b c d = 
611         choose_jump a b c d
612           (mk_fun (fun _ _ -> Tree.nil) "Tree.mk_nil2")
613           (mk_fun (Tree.tagged_sibling_ctx tree) "Tree.tagged_sibling_ctx")
614           (mk_fun (Tree.select_sibling_ctx tree) "Tree.select_sibling_ctx")
615           (mk_fun (Tree.tagged_foll_ctx tree) "Tree.tagged_foll_ctx")
616           (mk_fun (Tree.select_foll_ctx tree) "Tree.select_foll_ctx")
617           (mk_fun (Tree.next_element_ctx tree) "Tree.node_element_ctx")   
618           (mk_fun (Tree.next_sibling_ctx tree) "Tree.node_sibling_ctx")   
619                           
620       module SetTagKey =
621       struct 
622         type t = Tag.t*SList.t
623         let equal (t1,s1) (t2,s2) =  t1 == t2 && s1 == s2
624         let hash (t,s) = HASHINT2(t,s.SList.Node.id)
625       end
626         
627       module CachedTransTable = Hashtbl.Make(SetTagKey)
628       let td_trans = CachedTransTable.create 4093
629         
630         
631       let empty_size n =
632         let rec loop acc = function 0 -> acc
633           | n -> loop (SList.cons StateSet.empty acc) (n-1)
634         in loop SList.nil n
635              
636
637       module Fold2Res = Hashtbl.Make(struct 
638                                        type t = Formlistlist.t*SList.t*SList.t
639                                        let hash (f,s,t) = HASHINT3(f.Formlistlist.Node.id,
640                                                                    s.SList.Node.id,
641                                                                    t.SList.Node.id)
642                                        let equal (a,b,c) (d,e,f) = a==d && b == e && c == f
643                                      end)
644
645       let h_fold2 = Fold2Res.create BIG_H_SIZE
646       
647       let top_down ?(noright=false) a tree t slist ctx slot_size =      
648         let pempty = empty_size slot_size in    
649         let rempty = Array.make slot_size RS.empty in
650         (* evaluation starts from the right so we put sl1,res1 at the end *)
651         let eval_fold2_slist fll t (sl2,res2) (sl1,res1) =
652           let res = Array.copy rempty in
653           try
654             let r,b,btab = Fold2Res.find h_fold2 (fll,sl1,sl2) in
655             if b then for i=0 to slot_size - 1 do
656               res.(i) <- RS.merge btab.(i) t res1.(i) res2.(i);
657             done;
658             r,res
659           with
660              Not_found -> 
661                let btab = Array.make slot_size (false,false,false,false) in         
662                let rec fold l1 l2 fll i aq ab = 
663                  match fll.Formlistlist.Node.node,
664                    l1.SList.Node.node,
665                    l2.SList.Node.node
666                  with        
667                    | Formlistlist.Cons(fl,fll),
668                     SList.Cons(s1,ll1),
669                     SList.Cons(s2,ll2) ->
670                        let r',((b,_,_,_) as flags) = eval_formlist s1 s2 fl in
671                        let _ = btab.(i) <- flags
672                        in
673                        fold ll1 ll2 fll (i+1) (SList.cons r' aq) (b||ab)
674                    | _ -> aq,ab
675                in
676                let r,b = fold sl1 sl2 fll 0 SList.nil false in
677                Fold2Res.add h_fold2 (fll,sl1,sl2) (r,b,btab);
678                if b then for i=0 to slot_size - 1 do
679                  res.(i) <- RS.merge btab.(i) t res1.(i) res2.(i);
680                done;
681                r,res
682         in
683
684         let null_result = (pempty,Array.copy rempty) in
685         let rec loop t slist ctx=
686           if t == Tree.nil then null_result else get_trans t slist (Tree.tag tree t) ctx
687         and loop_tag tag t slist ctx =
688           if t == Tree.nil then null_result else get_trans t slist tag ctx
689         and loop_no_right t slist ctx = 
690           if t == Tree.nil then null_result else get_trans ~noright:true t slist (Tree.tag tree t) ctx
691         and get_trans ?(noright=false) t slist tag ctx =          
692           let cont = 
693             try
694               CachedTransTable.find td_trans (tag,slist)
695             with        
696               | Not_found ->
697                   let fl_list,llist,rlist,ca,da,sa,fa = 
698                     SList.fold 
699                       (fun set (fll_acc,lllacc,rllacc,ca,da,sa,fa) -> (* For each set *)
700                          let fl,ll,rr,ca,da,sa,fa = 
701                            StateSet.fold
702                              (fun q acc ->                          
703                                 List.fold_left 
704                                   (fun ((fl_acc,ll_acc,rl_acc,c_acc,d_acc,s_acc,f_acc) as acc) 
705                                      (ts,t)  ->
706                                        if (TagSet.mem tag ts)
707                                        then 
708                                          let _,_,f,_ = Transition.node t in
709                                          let (child,desc,below),(sibl,foll,after) = Formula.st f in
710                                            (Formlist.cons t fl_acc,
711                                             StateSet.union ll_acc below,
712                                             StateSet.union rl_acc after,
713                                             StateSet.union child c_acc,
714                                             StateSet.union desc d_acc,
715                                             StateSet.union sibl s_acc,
716                                             StateSet.union foll f_acc)           
717                                        else acc ) acc (
718                                     try Hashtbl.find a.trans q 
719                                     with
720                                         Not_found -> Printf.eprintf "Looking for state %i, doesn't exist!!!\n%!"
721                                           q;[]
722                                   )
723                                   
724                              ) set (Formlist.nil,StateSet.empty,StateSet.empty,ca,da,sa,fa)
725                          in (Formlistlist.cons fl fll_acc), (SList.cons ll lllacc), (SList.cons rr rllacc),ca,da,sa,fa)
726                       slist (Formlistlist.nil,SList.nil,SList.nil,StateSet.empty,StateSet.empty,StateSet.empty,StateSet.empty)
727                   in                    
728                     (* Logic to chose the first and next function *)
729                   let _,tags_below,_,tags_after = Tree.tags tree tag in
730 (*                let _ = Printf.eprintf "Tags below %s are : \n" (Tag.to_string tag) in
731                   let _ = Ptset.Int.iter (fun i -> Printf.eprintf "%s " (Tag.to_string i)) tags_below in
732                   let _ = Printf.eprintf "\n%!" in *)
733                   let tags_below = Ptset.Int.remove tag tags_below in
734                   let f_kind,first = choose_jump_down tree tags_below ca da a
735                   and n_kind,next = if noright then (`NIL, fun _ _ -> Tree.nil )
736                   else choose_jump_next tree tags_after sa fa a in
737                   let empty_res = null_result in
738                   let cont =
739                     match f_kind,n_kind with
740                       | `NIL,`NIL ->
741                           (fun t _ -> eval_fold2_slist fl_list t empty_res empty_res )
742                       |  _,`NIL -> (
743                            match f_kind with
744                              |`TAG(tag) ->
745                                 (fun t _ -> eval_fold2_slist fl_list t empty_res
746                                    (loop_tag tag (first t) llist t))
747                              | `ANY ->
748                                  (fun t _ -> eval_fold2_slist fl_list t empty_res
749                                     (loop (first t) llist t))
750                              | _ -> assert false)
751
752                       | `NIL,_ -> (
753                             match n_kind with
754                               |`TAG(tag) ->
755                                  (fun t ctx -> eval_fold2_slist fl_list t
756                                     (loop_tag tag (next t ctx) rlist ctx) empty_res)
757
758                               | `ANY ->
759                                   (fun t ctx -> eval_fold2_slist fl_list t
760                                      (loop (next t ctx) rlist ctx) empty_res)
761
762                               | _ -> assert false)
763
764                       | `TAG(tag1),`TAG(tag2) ->
765                             (fun t ctx -> eval_fold2_slist fl_list t
766                                (loop_tag tag2 (next t ctx) rlist ctx)
767                                (loop_tag tag1 (first t) llist t))
768
769                       | `TAG(tag),`ANY ->
770                           (fun t ctx -> eval_fold2_slist fl_list t
771                                (loop (next t ctx) rlist ctx)
772                                (loop_tag tag (first t) llist t))
773                       | `ANY,`TAG(tag) ->
774                             (fun t ctx ->
775                                eval_fold2_slist fl_list t
776                                  (loop_tag tag (next t ctx) rlist ctx)
777                                  (loop (first t) llist t) )
778                       | `ANY,`ANY ->
779                             (fun t ctx ->
780                                eval_fold2_slist fl_list t
781                                  (loop (next t ctx) rlist ctx)
782                                  (loop (first t) llist t) )
783                       | _ -> assert false
784                   in
785                   let cont = D_IF_( (fun t ctx ->
786                                        let a,b = cont t ctx in
787                                        register_trace tree t (slist,a,fl_list,first,next,ctx);
788                                          (a,b)
789                                     ) ,cont)
790                   in
791                   (CachedTransTable.add td_trans (tag,slist) cont;cont)
792           in cont t ctx
793             
794         in
795         (if noright then loop_no_right else loop) t slist ctx
796
797   
798         let run_top_down a tree =
799           let init = SList.cons a.init SList.nil in
800           let _,res = top_down a tree Tree.root init Tree.root 1 
801           in 
802             D_IGNORE_(
803               output_trace a tree "trace.html"
804                 (RS.fold (fun t a -> IntSet.add (Tree.id tree t) a) res.(0) IntSet.empty),
805               res.(0))
806         ;;
807
808         module Configuration =
809         struct
810           module Ptss = Set.Make(StateSet)
811           module IMap = Map.Make(StateSet)
812           type t = { hash : int;
813                         sets : Ptss.t;
814                         results : RS.t IMap.t }
815           let empty = { hash = 0;
816                         sets = Ptss.empty;
817                         results = IMap.empty;
818                       }
819           let is_empty c = Ptss.is_empty c.sets
820           let add c s r =
821             if Ptss.mem s c.sets then
822               { c with results = IMap.add s (RS.concat r (IMap.find s c.results)) c.results}
823             else
824               { hash = HASHINT2(c.hash,Ptset.Int.uid s);
825                 sets = Ptss.add s c.sets;
826                 results = IMap.add s r c.results
827               }
828
829           let pr fmt c = Format.fprintf fmt "{";
830             Ptss.iter (fun s -> StateSet.print fmt s;
831                         Format.fprintf fmt "  ") c.sets;
832             Format.fprintf fmt "}\n%!";
833             IMap.iter (fun k d -> 
834                          StateSet.print fmt k;
835                          Format.fprintf fmt "-> %i\n" (RS.length d)) c.results;                  
836             Format.fprintf fmt "\n%!"
837               
838           let merge c1 c2  =
839             let acc1 =
840               IMap.fold 
841                 ( fun s r acc ->
842                     IMap.add s
843                       (try 
844                          RS.concat r (IMap.find s acc)
845                        with
846                          | Not_found -> r) acc) c1.results IMap.empty 
847             in
848             let imap =
849                 IMap.fold (fun s r acc -> 
850                              IMap.add s
851                                (try 
852                                   RS.concat r (IMap.find s acc)
853                                 with
854                                   | Not_found -> r) acc)  c2.results acc1
855             in
856             let h,s =
857               Ptss.fold 
858                 (fun s (ah,ass) -> (HASHINT2(ah,Ptset.Int.uid s),
859                                     Ptss.add s ass))
860                 (Ptss.union c1.sets c2.sets) (0,Ptss.empty)
861             in
862               { hash = h;
863                 sets =s;
864                 results = imap }
865
866         end
867
868         let h_fold = Hashtbl.create 511 
869
870         let fold_f_conf  t slist fl_list conf dir= 
871           let rec loop sl fl acc =
872             match SList.node sl,fl with
873               |SList.Nil,[] -> acc
874               |SList.Cons(s,sll), formlist::fll ->
875                  let r',(rb,rb1,rb2,mark) = 
876                    let key = SList.hash sl,Formlist.hash formlist,dir in
877                    try 
878                      Hashtbl.find h_fold key
879                    with
880                       Not_found -> let res = 
881                         if dir then eval_formlist s Ptset.Int.empty formlist
882                         else eval_formlist  Ptset.Int.empty s formlist 
883                       in (Hashtbl.add h_fold key res;res)
884                  in
885                  if rb && ((dir&&rb1)|| ((not dir) && rb2))
886                  then 
887                  let acc = 
888                    let old_r = 
889                      try Configuration.IMap.find s conf.Configuration.results
890                      with Not_found -> RS.empty
891                    in
892                    Configuration.add acc r' (if mark then RS.cons t old_r else old_r)                   
893                  in
894                  loop sll fll acc
895                  else loop sll fll acc
896               | _ -> assert false
897           in
898             loop slist fl_list Configuration.empty
899
900         let h_trans = Hashtbl.create 4096
901
902         let get_up_trans slist ptag a tree =      
903           let key = (HASHINT2(SList.uid slist,ptag)) in
904             try
905           Hashtbl.find h_trans key              
906           with
907           | Not_found ->  
908               let f_list =
909                 Hashtbl.fold (fun q l acc ->
910                                 List.fold_left (fun fl_acc (ts,t)  ->
911                                                   if TagSet.mem ptag ts then Formlist.cons t fl_acc
912                                                   else fl_acc)
913                                   
914                                   acc l)
915                   a.trans Formlist.nil
916               in
917               let res = SList.fold (fun _ acc -> f_list::acc) slist [] 
918               in
919                 (Hashtbl.add h_trans key res;res) 
920                   
921
922               
923         let h_tdconf = Hashtbl.create 511 
924         let rec bottom_up a tree t conf next jump_fun root dotd init accu = 
925           if (not dotd) && (Configuration.is_empty conf ) then
926           accu,conf,next 
927           else
928
929           let below_right = Tree.is_below_right tree t next in 
930           
931           let accu,rightconf,next_of_next =         
932             if below_right then (* jump to the next *)
933             bottom_up a tree next conf (jump_fun next) jump_fun (Tree.next_sibling tree t) true init accu
934             else accu,Configuration.empty,next
935           in 
936           let sub =
937             if dotd then
938             if below_right then prepare_topdown a tree t true
939             else prepare_topdown a tree t false
940             else conf
941           in
942           let conf,next =
943             (Configuration.merge rightconf sub, next_of_next)
944           in
945           if t == root then  accu,conf,next else
946           let parent = Tree.binary_parent tree t in
947           let ptag = Tree.tag tree parent in
948           let dir = Tree.is_left tree t in
949           let slist = Configuration.Ptss.fold (fun e a -> SList.cons e a) conf.Configuration.sets SList.nil in
950           let fl_list = get_up_trans slist ptag a parent in
951           let slist = SList.rev (slist) in 
952           let newconf = fold_f_conf parent slist fl_list conf dir in
953           let accu,newconf = Configuration.IMap.fold (fun s res (ar,nc) ->
954                                                         if Ptset.Int.intersect s init then
955                                                           ( RS.concat res ar ,nc)
956                                                         else (ar,Configuration.add nc s res))
957             (newconf.Configuration.results) (accu,Configuration.empty) 
958           in
959
960             bottom_up a tree parent newconf next jump_fun root false init accu
961               
962         and prepare_topdown a tree t noright =
963           let tag = Tree.tag tree t in
964           let r = 
965             try
966               Hashtbl.find h_tdconf tag
967             with
968               | Not_found -> 
969                   let res = Hashtbl.fold (fun q l acc -> 
970                                             if List.exists (fun (ts,_) -> TagSet.mem tag ts) l
971                                             then Ptset.Int.add q acc
972                                             else acc) a.trans Ptset.Int.empty
973                   in Hashtbl.add h_tdconf tag res;res
974           in 
975 (*        let _ = pr ", among ";
976             StateSet.print fmt (Ptset.Int.elements r);
977             pr "\n%!";
978           in *)
979           let r = SList.cons r SList.nil in
980           let set,res = top_down (~noright:noright) a tree t r t 1 in
981           let set = match SList.node set with
982             | SList.Cons(x,_) ->x
983             | _ -> assert false 
984           in
985           Configuration.add Configuration.empty set res.(0) 
986
987
988
989         let run_bottom_up a tree k =
990           let t = Tree.root in
991           let trlist = Hashtbl.find a.trans (StateSet.choose a.init)
992           in
993           let init = List.fold_left 
994             (fun acc (_,t) ->
995                let _,_,f,_ = Transition.node t in 
996                let _,_,l = fst ( Formula.st f ) in
997                  StateSet.union acc l)
998             StateSet.empty trlist
999           in
1000           let tree1,jump_fun =
1001             match k with
1002               | `TAG (tag) -> 
1003                   (*Tree.tagged_lowest t tag, fun tree -> Tree.tagged_next tree tag*)
1004                   (Tree.tagged_desc tree tag t, let jump = Tree.tagged_foll_ctx tree tag
1005                   in fun n -> jump n t )
1006               | `CONTAINS(_) -> (Tree.text_below tree t,let jump = Tree.text_next tree 
1007                                  in fun n -> jump n t)
1008               | _ -> assert false
1009           in
1010           let tree2 = jump_fun tree1 in
1011           let rec loop t next acc = 
1012             let acc,conf,next_of_next = bottom_up a tree t
1013               Configuration.empty next jump_fun (Tree.root) true init acc
1014             in 
1015             let acc = Configuration.IMap.fold 
1016               ( fun s res acc -> if StateSet.intersect init s
1017                 then RS.concat res acc else acc) conf.Configuration.results acc
1018             in
1019               if Tree.is_nil next_of_next  (*|| Tree.equal next next_of_next *)then
1020                 acc
1021               else loop next_of_next (jump_fun next_of_next) acc
1022           in
1023           loop tree1 tree2 RS.empty
1024
1025
1026     end
1027           
1028     let top_down_count a t = let module RI = Run(Integer) in Integer.length (RI.run_top_down a t)
1029     let top_down a t = let module RI = Run(IdSet) in (RI.run_top_down a t)
1030     let bottom_up_count a t k = let module RI = Run(Integer) in Integer.length (RI.run_bottom_up a t k)
1031
1032