WIP
[tatoo.git] / src / ata.ml
index a4ea306..8a13705 100644 (file)
@@ -22,6 +22,68 @@ type move = [ `First_child
             | `Previous_sibling
             | `Stay ]
 
+module Move =
+  struct
+    type t = move
+    type 'a table = 'a array
+    let idx = function
+      | `First_child -> 0
+      | `Next_sibling -> 1
+      | `Parent -> 2
+      | `Previous_sibling -> 3
+      | `Stay -> 4
+    let ridx = function
+      | 0 -> `First_child
+      | 1 -> `Next_sibling
+      | 2 -> `Parent
+      | 3 -> `Previous_sibling
+      | 4 -> `Stay
+      | _ -> assert false
+
+    let create_table a = Array.make 5 a
+    let get m k = m.(idx k)
+    let set m k v = m.(idx k) <- v
+    let iter f m = Array.iteri (fun i v -> f (ridx i) v) m
+    let fold f m acc =
+      let acc = ref acc in
+      iter (fun i v -> acc := f i v !acc) m;
+      !acc
+    let for_all p m =
+      try
+        iter (fun i v -> if not (p i v) then raise Exit) m;
+        true
+      with
+        Exit -> false
+    let for_all2 p m1 m2 =
+      try
+        for i = 0 to 4 do
+          let v1 = m1.(i)
+          and v2 = m2.(i) in
+          if not (p (ridx i) v1 v2) then raise Exit
+        done;
+        true
+      with
+        Exit -> false
+
+    let exists p m =
+      try
+        iter (fun i v -> if p i v then raise Exit) m;
+        false
+      with
+        Exit -> true
+    let print ppf m =
+      match m with
+        `First_child -> fprintf ppf "%s" Pretty.down_arrow
+      | `Next_sibling -> fprintf ppf "%s" Pretty.right_arrow
+      | `Parent -> fprintf ppf "%s" Pretty.up_arrow
+      | `Previous_sibling -> fprintf ppf "%s" Pretty.left_arrow
+      | `Stay -> fprintf ppf "%s" Pretty.bullet
+
+    let print_table pr_e ppf m =
+      iter (fun i v -> fprintf ppf "%a: %a" print i pr_e v;
+        if (idx i) < 4 then fprintf ppf ", ") m
+  end
+
 type predicate = Move of move * State.t
                  | Is_first_child
                  | Is_next_sibling
@@ -43,15 +105,8 @@ struct
 
   let print ppf a =
     match a.node with
-    | Move (m, q) -> begin
-      match m with
-        `First_child -> fprintf ppf "%s" Pretty.down_arrow
-      | `Next_sibling -> fprintf ppf "%s" Pretty.right_arrow
-      | `Parent -> fprintf ppf "%s" Pretty.up_arrow
-      | `Previous_sibling -> fprintf ppf "%s" Pretty.left_arrow
-      | `Stay -> fprintf ppf "%s" Pretty.bullet
-    end;
-        fprintf ppf "%a" State.print q
+    | Move (m, q) ->
+      fprintf ppf "%a%a" Move.print m State.print q
     | Is_first_child -> fprintf ppf "%s?" Pretty.up_arrow
     | Is_next_sibling -> fprintf ppf "%s?" Pretty.left_arrow
     | Is k -> fprintf ppf "is-%a?" Tree.NodeKind.print k
@@ -107,12 +162,19 @@ struct
 
   let stay q = mk_move `Stay q
 
-  let get_states phi =
-    fold (fun phi acc ->
+  let get_states_by_move phi =
+    let table = Move.create_table StateSet.empty in
+    iter (fun phi ->
       match expr phi with
-      | Boolean.Atom ({ Atom.node = Move(_,q) ; _ }, _) ->  StateSet.add q acc
-      | _ -> acc
-    ) phi StateSet.empty
+      | Boolean.Atom ({ Atom.node = Move(v,q) ; _ }, _) ->
+        let s = Move.get table v in
+        Move.set table v (StateSet.add q s)
+      | _ -> ()
+    ) phi;
+    table
+  let get_states phi =
+    let table = get_states_by_move phi in
+    Move.fold (fun _ s acc -> StateSet.union s acc) table StateSet.empty
 
 end
 
@@ -144,7 +206,10 @@ end =
     let print ppf ?(sep="\n") l =
       iter (fun t ->
         let q, lab, f = Transition.node t in
-        fprintf ppf "%a, %a -> %a%s" State.print q QNameSet.print lab Formula.print f sep) l
+        fprintf ppf "%a, %a → %a%s"
+          State.print q
+          QNameSet.print lab
+          Formula.print f sep) l
   end
 
 
@@ -155,6 +220,7 @@ type t = {
   mutable starting_states : StateSet.t;
   mutable selecting_states: StateSet.t;
   transitions: (State.t, (QNameSet.t*Formula.t) list) Hashtbl.t;
+  mutable ranked_states : StateSet.t array
 }
 
 let uid t = t.id
@@ -162,7 +228,8 @@ let uid t = t.id
 let get_states a = a.states
 let get_starting_states a = a.starting_states
 let get_selecting_states a = a.selecting_states
-
+let get_states_by_rank a = a.ranked_states
+let get_max_rank a = Array.length a.ranked_states - 1
 
 let _pr_buff = Buffer.create 50
 let _str_fmt = formatter_of_buffer _pr_buff
@@ -178,12 +245,15 @@ let print fmt a =
      Number of states: %i@\n\
      Starting states: %a@\n\
      Selection states: %a@\n\
+     Ranked states: %a@\n\
      Alternating transitions:@\n"
     (a.id :> int)
     StateSet.print a.states
     (StateSet.cardinal a.states)
     StateSet.print a.starting_states
-    StateSet.print a.selecting_states;
+    StateSet.print a.selecting_states
+    (let r = ref 0 in Pretty.print_array ~sep:", " (fun ppf s ->
+      fprintf ppf "%i:%a" !r StateSet.print s; incr r)) a.ranked_states;
   let trs =
     Hashtbl.fold
       (fun q t acc -> List.fold_left (fun acc (s , f) -> (q,s,f)::acc) acc t)
@@ -191,18 +261,19 @@ let print fmt a =
       []
   in
   let sorted_trs = List.stable_sort (fun (q1, s1, _) (q2, s2, _) ->
-    let c = State.compare q1 q2 in - (if c == 0 then QNameSet.compare s1 s2 else c))
+    let c = State.compare q2 q1 in if c == 0 then QNameSet.compare s2 s1 else c)
     trs
   in
   let _ = _flush_str_fmt () in
-  let strs_strings, max_pre, max_all = List.fold_left (fun (accl, accp, acca) (q, s, f) ->
-    let s1 = State.print _str_fmt q; _flush_str_fmt () in
-    let s2 = QNameSet.print _str_fmt s;  _flush_str_fmt () in
-    let s3 = Formula.print _str_fmt f;  _flush_str_fmt () in
-    let pre = Pretty.length s1 + Pretty.length s2 in
-    let all = Pretty.length s3 in
-    ( (q, s1, s2, s3) :: accl, max accp pre, max acca all)
-  ) ([], 0, 0) sorted_trs
+  let strs_strings, max_pre, max_all =
+    List.fold_left (fun (accl, accp, acca) (q, s, f) ->
+      let s1 = State.print _str_fmt q; _flush_str_fmt () in
+      let s2 = QNameSet.print _str_fmt s;  _flush_str_fmt () in
+      let s3 = Formula.print _str_fmt f;  _flush_str_fmt () in
+      let pre = Pretty.length s1 + Pretty.length s2 in
+      let all = Pretty.length s3 in
+      ( (q, s1, s2, s3) :: accl, max accp pre, max acca all)
+    ) ([], 0, 0) sorted_trs
   in
   let line = Pretty.line (max_all + max_pre + 6) in
   let prev_q = ref State.dummy in
@@ -211,7 +282,8 @@ let print fmt a =
     if !prev_q != q && !prev_q != State.dummy then fprintf fmt "%s@\n"  line;
     prev_q := q;
     fprintf fmt "%s, %s" s1 s2;
-    fprintf fmt "%s" (Pretty.padding (max_pre - Pretty.length s1 - Pretty.length s2));
+    fprintf fmt "%s"
+      (Pretty.padding (max_pre - Pretty.length s1 - Pretty.length s2));
     fprintf fmt " %s  %s@\n" Pretty.right_arrow s3;
   ) strs_strings;
   fprintf fmt "%s@\n" line
@@ -290,8 +362,10 @@ let normalize_negations auto =
   let rec flip b f =
     match Formula.expr f with
       Boolean.True | Boolean.False -> if b then f else Formula.not_ f
-    | Boolean.Or(f1, f2) -> (if b then Formula.or_ else Formula.and_)(flip b f1) (flip b f2)
-    | Boolean.And(f1, f2) -> (if b then Formula.and_ else Formula.or_)(flip b f1) (flip b f2)
+    | Boolean.Or(f1, f2) ->
+      (if b then Formula.or_ else Formula.and_)(flip b f1) (flip b f2)
+    | Boolean.And(f1, f2) ->
+      (if b then Formula.and_ else Formula.or_)(flip b f1) (flip b f2)
     | Boolean.Atom(a, b') -> begin
       match a.Atom.node with
       | Move (m,  q) ->
@@ -328,26 +402,101 @@ let normalize_negations auto =
 
   while not (Queue.is_empty todo) do
     let (q, b) as key = Queue.pop todo in
-    let q' =
-      try
-        Hashtbl.find memo_state key
-      with
-        Not_found ->
-          let nq = if b then q else
-              let nq = State.make () in
-              auto.states <- StateSet.add nq auto.states;
-              nq
-          in
-          Hashtbl.add memo_state key nq; nq
-    in
-    let trans = try Hashtbl.find auto.transitions q with Not_found -> [] in
-    let trans' = List.map (fun (lab, f) -> lab, flip b f) trans in
-    Hashtbl.replace auto.transitions q' trans';
+    if not (StateSet.mem q auto.starting_states) then
+      let q' =
+        try
+          Hashtbl.find memo_state key
+        with
+          Not_found ->
+            let nq = if b then q else
+                let nq = State.make () in
+                auto.states <- StateSet.add nq auto.states;
+                nq
+            in
+            Hashtbl.add memo_state key nq; nq
+      in
+      let trans = try Hashtbl.find auto.transitions q with Not_found -> [] in
+      let trans' = List.map (fun (lab, f) -> lab, flip b f) trans in
+      Hashtbl.replace auto.transitions q' trans';
   done;
   cleanup_states auto
 
-
-
+(* [compute_dependencies auto] returns a hash table storing for each
+   states [q] a Move.table containing the set of states on which [q]
+   depends (loosely). [q] depends on [q'] if there is a transition
+   [q, {...} -> phi], where [q'] occurs in [phi].
+*)
+let compute_dependencies auto =
+  let edges = Hashtbl.create 17 in
+  StateSet.iter
+    (fun q -> Hashtbl.add edges q (Move.create_table StateSet.empty))
+    auto.starting_states;
+  Hashtbl.iter (fun q trans ->
+    let moves = try Hashtbl.find edges q with Not_found ->
+      let m = Move.create_table StateSet.empty in
+      Hashtbl.add edges q m;
+      m
+    in
+    List.iter (fun (_, phi) ->
+      let m_phi = Formula.get_states_by_move phi in
+      Move.iter (fun m set ->
+        Move.set moves m (StateSet.union set (Move.get moves m)))
+        m_phi) trans) auto.transitions;
+
+  edges
+
+
+let compute_rank auto =
+  let dependencies = compute_dependencies auto in
+  let upward = [ `Stay ; `Parent ; `Previous_sibling ] in
+  let downward = [ `Stay; `First_child; `Next_sibling ] in
+  let swap dir = if dir == upward then downward else upward in
+  let is_satisfied dir q t =
+    Move.for_all (fun d set ->
+      if List.mem d dir then
+        StateSet.(is_empty (remove q set))
+      else StateSet.is_empty set) t
+  in
+  let update_dependencies dir initacc =
+    let rec loop acc =
+      let new_acc =
+        Hashtbl.fold (fun q deps acc ->
+          let to_remove = StateSet.union acc initacc in
+          List.iter
+            (fun m ->
+              Move.set deps m (StateSet.diff (Move.get deps m) to_remove)
+            )
+            dir;
+          if is_satisfied dir q deps then StateSet.add q acc else acc
+        ) dependencies acc
+      in
+      if acc == new_acc then new_acc else loop new_acc
+    in
+    let satisfied = loop StateSet.empty in
+    StateSet.iter (fun q ->
+      Hashtbl.remove dependencies q) satisfied;
+    satisfied
+  in
+  let current_states = ref StateSet.empty in
+  let rank_list = ref [] in
+  let rank = ref 0 in
+  let current_dir = ref upward in
+  let detect_cycle = ref 0 in
+  while Hashtbl.length dependencies != 0 do
+    let new_sat = update_dependencies !current_dir !current_states in
+    if StateSet.is_empty new_sat then incr detect_cycle;
+    if !detect_cycle > 2 then assert false;
+    rank_list := (!rank, new_sat) :: !rank_list;
+    rank := !rank + 1;
+    current_dir := swap !current_dir;
+    current_states := StateSet.union new_sat !current_states;
+  done;
+  let by_rank = Hashtbl.create 17 in
+  List.iter (fun (r,s) ->
+    let set = try Hashtbl.find by_rank r with Not_found -> StateSet.empty in
+    Hashtbl.replace by_rank r (StateSet.union s set)) !rank_list;
+  auto.ranked_states <-
+    Array.init (Hashtbl.length by_rank) (fun i -> Hashtbl.find by_rank i)
 
 
 module Builder =
@@ -364,26 +513,9 @@ module Builder =
           starting_states = StateSet.empty;
           selecting_states = StateSet.empty;
           transitions = Hashtbl.create MED_H_SIZE;
+          ranked_states = [| |]
         }
       in
-      (*
-      at_exit (fun () ->
-        let n4 = ref 0 in
-        let n2 = ref 0 in
-        Cache.N2.iteri (fun _ _ _ b -> if b then incr n2) auto.cache2;
-        Cache.N4.iteri (fun _ _ _ _ _ b -> if b then incr n4) auto.cache4;
-        Logger.msg `STATS "automaton %i, cache2: %i entries, cache6: %i entries"
-          (auto.id :> int) !n2 !n4;
-        let c2l, c2u = Cache.N2.stats auto.cache2 in
-        let c4l, c4u = Cache.N4.stats auto.cache4 in
-        Logger.msg `STATS
-          "cache2: length: %i, used: %i, occupation: %f"
-          c2l c2u (float c2u /. float c2l);
-        Logger.msg `STATS
-          "cache4: length: %i, used: %i, occupation: %f"
-          c4l c4u (float c4u /. float c4l)
-
-      ); *)
       auto
 
     let add_state a ?(starting=false) ?(selecting=false) q =
@@ -418,6 +550,7 @@ module Builder =
     let finalize a =
       complete_transitions a;
       normalize_negations a;
+      compute_rank a;
       a
   end
 
@@ -451,6 +584,7 @@ let rename_states mapper a =
         (fun l ->
           (List.map (fun (labels, form) -> (labels, map_form rename form)) l))
         a.transitions;
+    ranked_states = Array.map (map_set rename) a.ranked_states
   }
 
 let copy a =
@@ -475,16 +609,17 @@ let concat a1 a2 =
     (fun q ->
       Hashtbl.replace a1.transitions q [(QNameSet.any, link_phi)])
     a2.starting_states;
-  { a1 with
+  let a = { a1 with
     states = StateSet.union a1.states a2.states;
     selecting_states = a2.selecting_states;
     transitions = a1.transitions;
   }
+  in compute_rank a; a
 
 let merge a1 a2 =
   let a1 = copy a1 in
   let a2 = copy a2 in
-  { a1 with
+  let a = { a1 with
     states = StateSet.union a1.states a2.states;
     selecting_states = StateSet.union a1.selecting_states a2.selecting_states;
     starting_states = StateSet.union a1.starting_states a2.starting_states;
@@ -493,11 +628,12 @@ let merge a1 a2 =
         Hashtbl.iter (fun k v -> Hashtbl.add a1.transitions k v) a2.transitions
       in
       a1.transitions
-  }
+  } in
+  compute_rank a ; a
 
 
 let link a1 a2 q link_phi =
-  { a1 with
+  let a = { a1 with
     states = StateSet.union a1.states a2.states;
     selecting_states = StateSet.singleton q;
     starting_states = StateSet.union a1.starting_states a2.starting_states;
@@ -508,6 +644,8 @@ let link a1 a2 q link_phi =
       Hashtbl.add a1.transitions q [(QNameSet.any, link_phi)];
       a1.transitions
   }
+  in
+  compute_rank a; a
 
 let union a1 a2 =
   let a1 = copy a1 in
@@ -536,7 +674,7 @@ let inter a1 a2 =
 let neg a =
   let a = copy a in
   let q = State.make () in
-  let link_phi = 
+  let link_phi =
     StateSet.fold
       (fun q phi -> Formula.(and_ (not_(stay q)) phi))
       a.selecting_states
@@ -548,7 +686,6 @@ let neg a =
       selecting_states = StateSet.singleton q;
     }
   in
-  normalize_negations a; a
+  normalize_negations a; compute_rank a; a
 
 let diff a1 a2 = inter a1 (neg a2)
-