WIP

2025-02-24 05:18:58 +00:00 · 2024-03-21 12:00:52 +01:00 · 2024-03-21 12:00:52 +01:00 · a4b810f511
commit a4b810f511
parent 0bd3365c24
13 changed files with 68 additions and 550 deletions
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/ExpansionStrategy.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/ExpansionStrategy.java
@ -0,0 +1,7 @@
+package nu.marginalia.functions.searchquery.query_parser;
+
+import nu.marginalia.functions.searchquery.query_parser.model.QWordGraph;
+
+public interface ExpansionStrategy {
+    void expand(QWordGraph graph);
+}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryExpansion.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryExpansion.java
@ -1,9 +1,9 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
+package nu.marginalia.functions.searchquery.query_parser;

 import ca.rmen.porterstemmer.PorterStemmer;
 import com.google.inject.Inject;
-import nu.marginalia.functions.searchquery.query_parser.variant.model.QWord;
-import nu.marginalia.functions.searchquery.query_parser.variant.model.QWordGraph;
+import nu.marginalia.functions.searchquery.query_parser.model.QWord;
+import nu.marginalia.functions.searchquery.query_parser.model.QWordGraph;
 import nu.marginalia.segmentation.NgramLexicon;
 import nu.marginalia.term_frequency_dict.TermFrequencyDict;
 import org.apache.commons.lang3.StringUtils;
@ -40,7 +40,7 @@ public class QueryExpansion {
            strategy.expand(graph);
        }

-        return null;
+        return graph;
    }

    private static final Pattern dashPattern = Pattern.compile("-");
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/QueryPermutation.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/QueryPermutation.java
@ -1,229 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser;
-
-import nu.marginalia.functions.searchquery.query_parser.token.Token;
-import nu.marginalia.functions.searchquery.query_parser.token.TokenType;
-import nu.marginalia.language.WordPatterns;
-import org.slf4j.Logger;
-import org.slf4j.LoggerFactory;
-
-import java.util.ArrayList;
-import java.util.Collections;
-import java.util.Comparator;
-import java.util.List;
-import java.util.function.Predicate;
-import java.util.regex.Pattern;
-import java.util.stream.Collectors;
-
-import static java.util.stream.Stream.concat;
-
-public class QueryPermutation {
-    private final Logger logger = LoggerFactory.getLogger(getClass());
-    private final QueryVariants queryVariants;
-
-    public static final Pattern wordPattern = Pattern.compile("[#]?[_@.a-zA-Z0-9'+\\-\\u00C0-\\u00D6\\u00D8-\\u00f6\\u00f8-\\u00ff]+[#]?");
-    public static final Pattern wordAppendixPattern = Pattern.compile("[.]?[0-9a-zA-Z\\u00C0-\\u00D6\\u00D8-\\u00f6\\u00f8-\\u00ff]{1,3}[0-9]?");
-
-    public static final Predicate<String> wordQualitiesPredicate = wordPattern.asMatchPredicate();
-
-    public static final Predicate<String> wordAppendixPredicate = wordAppendixPattern.asMatchPredicate();
-    public static final Predicate<String> wordPredicateEither = wordQualitiesPredicate.or(wordAppendixPredicate);
-
-    public QueryPermutation(QueryVariants queryVariants) {
-        this.queryVariants = queryVariants;
-    }
-
-    public List<List<Token>> permuteQueries(List<Token> items) {
-        int start = -1;
-        int end = items.size();
-
-        for (int i = 0; i < items.size(); i++) {
-            var token = items.get(i);
-
-            if (start < 0) {
-                if (token.type == TokenType.LITERAL_TERM && wordQualitiesPredicate.test(token.str)) {
-                    start = i;
-                }
-            }
-            else {
-                if (token.type != TokenType.LITERAL_TERM || !wordPredicateEither.test(token.str)) {
-                    end = i;
-                    break;
-                }
-            }
-        }
-
-        if (start >= 0 && end - start > 1) {
-            List<List<Token>> permuteParts = combineSearchTerms(items.subList(start, end));
-            int s = start;
-            int e = end;
-            return permuteParts.stream().map(part ->
-                            concat(items.subList(0, s).stream(), concat(part.stream(), items.subList(e, items.size()).stream()))
-                                    .collect(Collectors.toList()))
-                    .peek(lst -> lst.removeIf(this::isJunkWord))
-                    .limit(24)
-                    .collect(Collectors.toList());
-        }
-        else {
-            return List.of(items);
-        }
-    }
-
-
-    public List<List<Token>> permuteQueriesNew(List<Token> items) {
-        int start = -1;
-        int end = items.size();
-
-        for (int i = 0; i < items.size(); i++) {
-            var token = items.get(i);
-
-            if (start < 0) {
-                if (token.type == TokenType.LITERAL_TERM && wordQualitiesPredicate.test(token.str)) {
-                    start = i;
-                }
-            }
-            else {
-                if (token.type != TokenType.LITERAL_TERM || !wordPredicateEither.test(token.str)) {
-                    end = i;
-                    break;
-                }
-            }
-        }
-
-        if (start >= 0 && end - start >= 1) {
-            var result = queryVariants.getQueryVariants(items.subList(start, end));
-
-            logger.debug("{}", result);
-
-            if (result.isEmpty()) {
-                logger.warn("Empty variants result, falling back on old code");
-                return permuteQueries(items);
-            }
-
-            List<List<Token>> queryVariants = new ArrayList<>();
-            for (var query : result.faithful) {
-                var tokens = query.terms.stream().map(term -> new Token(TokenType.LITERAL_TERM, term)).collect(Collectors.toList());
-                tokens.addAll(result.nonLiterals);
-
-                queryVariants.add(tokens);
-            }
-            for (var query : result.alternative) {
-                if (queryVariants.size() >= 6)
-                    break;
-
-                var tokens = query.terms.stream().map(term -> new Token(TokenType.LITERAL_TERM, term)).collect(Collectors.toList());
-                tokens.addAll(result.nonLiterals);
-
-                queryVariants.add(tokens);
-            }
-
-            List<List<Token>> returnValue = new ArrayList<>(queryVariants.size());
-            for (var variant: queryVariants) {
-                List<Token> r = new ArrayList<>(start + variant.size() + (items.size() - end));
-                r.addAll(items.subList(0, start));
-                r.addAll(variant);
-                r.addAll(items.subList(end, items.size()));
-                returnValue.add(r);
-            }
-
-            return returnValue;
-
-        }
-        else {
-            return List.of(items);
-        }
-    }
-
-    private boolean isJunkWord(Token token) {
-        if (WordPatterns.isStopWord(token.str) &&
-                !token.str.matches("^(\\d+|([a-z]+:.*))$")) {
-            return true;
-        }
-        return switch (token.str) {
-            case "vs", "versus", "or", "and" -> true;
-            default -> false;
-        };
-    }
-
-    private List<List<Token>> combineSearchTerms(List<Token> subList) {
-        int size = subList.size();
-        if (size < 1) {
-            return Collections.emptyList();
-        }
-        else if (size == 1) {
-            if (WordPatterns.isStopWord(subList.get(0).str)) {
-                return Collections.emptyList();
-            }
-            return List.of(subList);
-        }
-
-        List<List<Token>> results = new ArrayList<>(size*(size+1)/2);
-
-        if (subList.size() <= 4 && subList.get(0).str.length() >= 2 && !isPrefixWord(subList.get(subList.size()-1).str)) {
-            results.add(List.of(joinTokens(subList)));
-        }
-        outer: for (int i = size - 1; i >= 1; i--) {
-
-            var left = combineSearchTerms(subList.subList(0, i));
-            var right = combineSearchTerms(subList.subList(i, size));
-
-            for (var l : left) {
-                if (results.size() > 48) {
-                    break outer;
-                }
-
-                for (var r : right) {
-                    if (results.size() > 48) {
-                        break  outer;
-                    }
-
-                    List<Token> combined = new ArrayList<>(l.size() + r.size());
-                    combined.addAll(l);
-                    combined.addAll(r);
-                    if (!results.contains(combined)) {
-                        results.add(combined);
-                    }
-                }
-            }
-        }
-        if (!results.contains(subList)) {
-            results.add(subList);
-        }
-        Comparator<List<Token>> tc = (o1, o2) -> {
-            int dJoininess = o2.stream().mapToInt(s->(int)Math.pow(joininess(s.str), 2)).sum() -
-                    o1.stream().mapToInt(s->(int)Math.pow(joininess(s.str), 2)).sum();
-            if (dJoininess == 0) {
-                return (o2.stream().mapToInt(s->(int)Math.pow(rightiness(s.str), 2)).sum() -
-                        o1.stream().mapToInt(s->(int)Math.pow(rightiness(s.str), 2)).sum());
-            }
-            return (int) Math.signum(dJoininess);
-        };
-        results.sort(tc);
-        return results;
-    }
-
-    private boolean isPrefixWord(String str) {
-        return switch (str) {
-            case "the", "of", "when" -> true;
-            default -> false;
-        };
-    }
-
-    int joininess(String s) {
-        return (int) s.chars().filter(c -> c == '_').count();
-    }
-    int rightiness(String s) {
-        int rightiness = 0;
-        for (int i = 0; i < s.length(); i++) {
-            if (s.charAt(i) == '_') {
-                rightiness+=i;
-            }
-        }
-        return rightiness;
-    }
-
-    private Token joinTokens(List<Token> subList) {
-        return new Token(TokenType.LITERAL_TERM,
-                subList.stream().map(t -> t.str).collect(Collectors.joining("_")),
-                subList.stream().map(t -> t.str).collect(Collectors.joining(" ")));
-    }
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/QueryVariants.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/QueryVariants.java
@ -1,207 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser;
-
-import nu.marginalia.functions.searchquery.query_parser.token.Token;
-import nu.marginalia.functions.searchquery.query_parser.token.TokenType;
-import nu.marginalia.functions.searchquery.query_parser.variant.QueryVariant;
-import nu.marginalia.functions.searchquery.query_parser.variant.QueryVariantSet;
-import nu.marginalia.functions.searchquery.query_parser.variant.QueryWord;
-import nu.marginalia.util.language.EnglishDictionary;
-import nu.marginalia.LanguageModels;
-import nu.marginalia.keyword.KeywordExtractor;
-import nu.marginalia.language.sentence.SentenceExtractor;
-import nu.marginalia.term_frequency_dict.TermFrequencyDict;
-import nu.marginalia.language.model.DocumentSentence;
-import nu.marginalia.language.model.WordSpan;
-
-import java.util.*;
-import java.util.regex.Pattern;
-
-public class QueryVariants {
-    private final KeywordExtractor keywordExtractor;
-    private final TermFrequencyDict dict;
-
-    private final EnglishDictionary englishDictionary;
-    private final ThreadLocal<SentenceExtractor> sentenceExtractor;
-
-    public QueryVariants(LanguageModels lm,
-                         TermFrequencyDict dict,
-                         EnglishDictionary englishDictionary) {
-        this.englishDictionary = englishDictionary;
-        this.keywordExtractor = new KeywordExtractor();
-        this.sentenceExtractor = ThreadLocal.withInitial(() -> new SentenceExtractor(lm));
-        this.dict = dict;
-    }
-
-
-
-    public QueryVariantSet getQueryVariants(List<Token> query) {
-        final JoinedQueryAndNonLiteralTokens joinedQuery = joinQuery(query);
-
-        final TreeMap<Integer, List<WordSpan>> byStart = new TreeMap<>();
-
-        var se = sentenceExtractor.get();
-        var sentence = se.extractSentence(joinedQuery.joinedQuery);
-
-        for (int i = 0; i < sentence.posTags.length; i++) {
-            if (sentence.posTags[i].startsWith("N") || sentence.posTags[i].startsWith("V")) {
-                sentence.posTags[i] = "NNP";
-            }
-            else if ("JJ".equals(sentence.posTags[i]) || "CD".equals(sentence.posTags[i]) || sentence.posTags[i].startsWith("P")) {
-                sentence.posTags[i] = "NNP";
-                sentence.setIsStopWord(i, false);
-            }
-        }
-
-        for (var kw : keywordExtractor.getKeywordsFromSentence(sentence)) {
-            byStart.computeIfAbsent(kw.start, k -> new ArrayList<>()).add(kw);
-        }
-
-        final List<ArrayList<WordSpan>> livingSpans = new ArrayList<>();
-
-        var first = byStart.firstEntry();
-        if (first == null) {
-            var span = new WordSpan(0, sentence.length());
-            byStart.put(0, List.of(span));
-        }
-        else if (first.getKey() > 0) {
-            List<WordSpan> elongatedFirstWords = new ArrayList<>(first.getValue().size());
-
-            first.getValue().forEach(span -> {
-                elongatedFirstWords.add(new WordSpan(0, span.start));
-                elongatedFirstWords.add(new WordSpan(0, span.end));
-            });
-
-            byStart.put(0, elongatedFirstWords);
-        }
-
-        final List<List<QueryWord>> goodSpans = getWordSpans(byStart, sentence, livingSpans);
-
-        List<List<String>> faithfulQueries = new ArrayList<>();
-        List<List<String>> alternativeQueries = new ArrayList<>();
-
-        for (var ls : goodSpans) {
-            var last = ls.get(ls.size() - 1);
-
-            if (!last.wordOriginal.isBlank() && !Character.isUpperCase(last.wordOriginal.charAt(0))) {
-                var altLast = englishDictionary.getWordVariants(last.word);
-                for (String s : altLast) {
-                    List<String> newList = new ArrayList<>(ls.size());
-                    for (int i = 0; i < ls.size() - 1; i++) {
-                        newList.add(ls.get(i).word);
-                    }
-                    newList.add(s);
-                    alternativeQueries.add(newList);
-                }
-            }
-
-        }
-
-        QueryVariantSet returnValue = new QueryVariantSet();
-
-        returnValue.faithful.addAll(evaluateQueries(faithfulQueries));
-        returnValue.alternative.addAll(evaluateQueries(alternativeQueries));
-
-        returnValue.faithful.sort(Comparator.comparing(QueryVariant::getValue));
-        returnValue.alternative.sort(Comparator.comparing(QueryVariant::getValue));
-
-        returnValue.nonLiterals.addAll(joinedQuery.nonLiterals);
-
-        return returnValue;
-    }
-
-    final Pattern underscore = Pattern.compile("_");
-
-    private List<QueryVariant> evaluateQueries(List<List<String>> queryStrings) {
-        Set<QueryVariant> variantsSet = new HashSet<>();
-        List<QueryVariant> ret = new ArrayList<>();
-        for (var lst : queryStrings) {
-            double q = 0;
-            for (var word : lst) {
-                String[] parts = underscore.split(word);
-                double qp = 0;
-                for (String part : parts) {
-                    qp += 1./(1+ dict.getTermFreq(part));
-                }
-                q += 1.0 / qp;
-            }
-            var qv = new QueryVariant(lst, q);
-            if (variantsSet.add(qv)) {
-                ret.add(qv);
-            }
-        }
-        return ret;
-    }
-
-    private List<List<QueryWord>> getWordSpans(TreeMap<Integer, List<WordSpan>> byStart, DocumentSentence sentence, List<ArrayList<WordSpan>> livingSpans) {
-        List<List<QueryWord>> goodSpans = new ArrayList<>();
-        for (int i = 0; i < 1; i++) {
-            var spans = byStart.get(i);
-
-
-            if (spans == null )
-                continue;
-
-            for (var span : spans) {
-                ArrayList<WordSpan> fragment = new ArrayList<>();
-                fragment.add(span);
-                livingSpans.add(fragment);
-            }
-
-            if (sentence.posTags[i].startsWith("N") || sentence.posTags[i].startsWith("V")) break;
-        }
-
-
-        while (!livingSpans.isEmpty()) {
-
-            final List<ArrayList<WordSpan>> newLivingSpans = new ArrayList<>(livingSpans.size());
-
-            for (var span : livingSpans) {
-                int end = span.get(span.size()-1).end;
-
-                if (end == sentence.length()) {
-                    var gs = new ArrayList<QueryWord>(span.size());
-                    for (var s : span) {
-                        gs.add(new QueryWord(sentence.constructStemmedWordFromSpan(s), sentence.constructWordFromSpan(s),
-                                s.size() == 1 ? sentence.words[s.start] : ""));
-                    }
-                    goodSpans.add(gs);
-                }
-                var nextWordsKey = byStart.ceilingKey(end);
-
-                if (null == nextWordsKey)
-                    continue;
-
-                for (var next : byStart.get(nextWordsKey)) {
-                    var newSpan = new ArrayList<WordSpan>(span.size() + 1);
-                    newSpan.addAll(span);
-                    newSpan.add(next);
-                    newLivingSpans.add(newSpan);
-                }
-            }
-
-            livingSpans.clear();
-            livingSpans.addAll(newLivingSpans);
-        }
-
-        return goodSpans;
-    }
-
-
-    private JoinedQueryAndNonLiteralTokens joinQuery(List<Token> query) {
-        StringJoiner s = new StringJoiner(" ");
-        List<Token> leftovers = new ArrayList<>(5);
-
-        for (var t : query) {
-            if (t.type == TokenType.LITERAL_TERM) {
-                s.add(t.displayStr);
-            }
-            else {
-                leftovers.add(t);
-            }
-        }
-
-        return new JoinedQueryAndNonLiteralTokens(s.toString(), leftovers);
-    }
-
-    record JoinedQueryAndNonLiteralTokens(String joinedQuery, List<Token> nonLiterals) {}
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/model/QWord.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/model/QWord.java
@ -1,4 +1,4 @@
-package nu.marginalia.functions.searchquery.query_parser.variant.model;
+package nu.marginalia.functions.searchquery.query_parser.model;

 import ca.rmen.porterstemmer.PorterStemmer;

--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/model/QWordGraph.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/model/QWordGraph.java
@ -1,4 +1,4 @@
-package nu.marginalia.functions.searchquery.query_parser.variant.model;
+package nu.marginalia.functions.searchquery.query_parser.model;

 import org.jetbrains.annotations.NotNull;

@ -15,8 +15,7 @@ import java.util.stream.Stream;
 public class QWordGraph implements Iterable<QWord> {


-    public record QWordGraphLink(QWord from, QWord to) {
-    }
+    public record QWordGraphLink(QWord from, QWord to) {}

    private final List<QWordGraphLink> links = new ArrayList<>();
    private final Map<QWord, List<QWord>> fromTo = new HashMap<>();
@ -121,8 +120,6 @@ public class QWordGraph implements Iterable<QWord> {
    // understanding which vertexes can be re-ordered without changing
    // the semantics of the encoded query.
    public boolean isBypassed(QWord word, QWord begin, QWord end) {
-        assert word.isOriginal() : "Can only bypass original words";
-
        Set<QWord> edge = new HashSet<>();
        Set<QWord> visited = new HashSet<>();

@ -163,6 +160,7 @@ public class QWordGraph implements Iterable<QWord> {
        List<QWord> edge = new ArrayList<>();
        List<QWord> visited = new ArrayList<>();

+        visited.add(begin);
        edge.add(begin);

        while (!edge.isEmpty()) {
@ -172,7 +170,9 @@ public class QWordGraph implements Iterable<QWord> {
                if (Objects.equals(w, end))
                    continue;

-                assert (!w.isEnd() && end.isEnd()) : "Graph has a path beyond the specified end vertex";
+                if (w.isEnd()) {
+                    assert end.isEnd() : "Graph has a path beyond the specified end vertex " + end;
+                }

                next.addAll(getNext(w));
            }
@ -182,7 +182,7 @@ public class QWordGraph implements Iterable<QWord> {
            edge = next;
        }

-        return visited;
+        return visited.stream().distinct().toList();
    }

    /** Returns a list of subgraphs that are connected on the path from
@ -201,7 +201,7 @@ public class QWordGraph implements Iterable<QWord> {

        List<QWord> points = nodesBetween(begin, end)
                .stream()
-                .filter(w -> isBypassed(w, begin, end))
+                .filter(w -> !isBypassed(w, begin, end))
                .toList();

        for (int i = 0; i < points.size() - 1; i++) {
@ -214,6 +214,36 @@ public class QWordGraph implements Iterable<QWord> {
        return subgraphs;
    }

+    public String compileToQuery() {
+        return compileToQuery(QWord.beg(), QWord.end());
+    }
+
+    public String compileToQuery(QWord begin, QWord end) {
+        StringJoiner sj = new StringJoiner(" ");
+
+        for (var subgraph : getSubgraphs(begin, end)) {
+            if (getNext(subgraph.from).equals(List.of(subgraph.to))) {
+                if (subgraph.from.isBeg())
+                    continue;
+
+                sj.add(subgraph.from.word());
+            }
+            else {
+                StringJoiner branchJoiner = new StringJoiner(" | ", "( ", " )");
+                if (Objects.equals(subgraph.from, begin)) {
+                    for (QWord path : getNext(subgraph.from)) {
+                        branchJoiner.add(compileToQuery(path, subgraph.to));
+                    }
+                }
+                else {
+                    branchJoiner.add(compileToQuery(subgraph.from, subgraph.to));
+                }
+                sj.add(branchJoiner.toString());
+            }
+        }
+
+        return sj.toString();
+    }

    @NotNull
    @Override
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/ExpansionStrategy.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/ExpansionStrategy.java
@ -1,7 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
-
-import nu.marginalia.functions.searchquery.query_parser.variant.model.QWordGraph;
-
-public interface ExpansionStrategy {
-    void expand(QWordGraph graph);
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryVariant.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryVariant.java
@ -1,17 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
-
-import lombok.AllArgsConstructor;
-import lombok.EqualsAndHashCode;
-import lombok.Getter;
-import lombok.ToString;
-
-import java.util.List;
-
-@AllArgsConstructor
-@Getter
-@ToString
-@EqualsAndHashCode
-public class QueryVariant {
-    public final List<String> terms;
-    public final double value;
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryVariantSet.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryVariantSet.java
@ -1,21 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
-
-import lombok.Getter;
-import lombok.ToString;
-import nu.marginalia.functions.searchquery.query_parser.token.Token;
-
-import java.util.ArrayList;
-import java.util.List;
-
-@Getter
-@ToString
-public class QueryVariantSet {
-    public final List<QueryVariant> faithful = new ArrayList<>();
-    public final List<QueryVariant> alternative = new ArrayList<>();
-
-    public final List<Token> nonLiterals = new ArrayList<>();
-
-    public boolean isEmpty() {
-        return faithful.isEmpty() && alternative.isEmpty() && nonLiterals.isEmpty();
-    }
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryWord.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/QueryWord.java
@ -1,10 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
-
-import lombok.AllArgsConstructor;
-
-@AllArgsConstructor
-public class QueryWord {
-    public final String stemmed;
-    public final String word;
-    public final String wordOriginal;
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/VariantStrategy.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/query_parser/variant/VariantStrategy.java
@ -1,8 +0,0 @@
-package nu.marginalia.functions.searchquery.query_parser.variant;
-
-import java.util.Collection;
-import java.util.List;
-
-public interface VariantStrategy {
-    Collection<? extends List<String>> constructVariants(List<QueryWord> ls);
-}
--- a/code/functions/search-query/java/nu/marginalia/functions/searchquery/svc/QueryFactory.java
+++ b/code/functions/search-query/java/nu/marginalia/functions/searchquery/svc/QueryFactory.java
@ -11,8 +11,6 @@ import nu.marginalia.language.WordPatterns;
 import nu.marginalia.api.searchquery.model.query.QueryParams;
 import nu.marginalia.api.searchquery.model.query.ProcessedQuery;
 import nu.marginalia.functions.searchquery.query_parser.QueryParser;
-import nu.marginalia.functions.searchquery.query_parser.QueryPermutation;
-import nu.marginalia.functions.searchquery.query_parser.QueryVariants;
 import nu.marginalia.functions.searchquery.query_parser.token.Token;
 import nu.marginalia.functions.searchquery.query_parser.token.TokenType;
 import nu.marginalia.term_frequency_dict.TermFrequencyDict;
@ -29,43 +27,19 @@ public class QueryFactory {
    private final Logger logger = LoggerFactory.getLogger(getClass());

    private static final int RETAIN_QUERY_VARIANT_COUNT = 5;
-    private final ThreadLocal<QueryVariants> queryVariants;
    private final QueryParser queryParser = new QueryParser();


    @Inject
    public QueryFactory(LanguageModels lm,
                        TermFrequencyDict dict,
-                        EnglishDictionary englishDictionary) {
-        this.queryVariants = ThreadLocal.withInitial(() -> new QueryVariants(lm ,dict, englishDictionary));
+                        EnglishDictionary englishDictionary)
+    {
    }


-    public QueryPermutation getQueryPermutation() {
-        return new QueryPermutation(queryVariants.get());
-    }

    public ProcessedQuery createQuery(QueryParams params) {
-        final var processedQuery =  createQuery(getQueryPermutation(), params);
-        final List<SearchSubquery> subqueries = processedQuery.specs.subqueries;
-
-        // There used to be a piece of logic here that would try to figure out which one of these subqueries were the "best",
-        // it's gone for the moment, but it would be neat if it resurrected somehow
-
-        trimArray(subqueries, RETAIN_QUERY_VARIANT_COUNT);
-
-        return processedQuery;
-    }
-
-    private void trimArray(List<?> arr, int maxSize) {
-        if (arr.size() > maxSize) {
-            arr.subList(0, arr.size() - maxSize).clear();
-        }
-    }
-
-    public ProcessedQuery createQuery(QueryPermutation queryPermutation,
-                                      QueryParams params)
-    {
        final var query = params.humanQuery();

        if (query.length() > 1000) {
@ -100,17 +74,19 @@ public class QueryFactory {
            t.visit(qualityLimits);
        }

-        var queryPermutations = queryPermutation.permuteQueriesNew(basicQuery);
+//        var queryPermutations = queryPermutation.permuteQueriesNew(basicQuery);
        List<SearchSubquery> subqueries = new ArrayList<>();
+        QuerySearchTermsAccumulator termsAccumulator = new QuerySearchTermsAccumulator(basicQuery);
+        domain = termsAccumulator.domain;

-        for (var parts : queryPermutations) {
-            QuerySearchTermsAccumulator termsAccumulator = new QuerySearchTermsAccumulator(parts);
-
-            domain = termsAccumulator.domain;
-
-            SearchSubquery subquery = termsAccumulator.createSubquery();
-            subqueries.add(subquery);
-        }
+//        for (var parts : queryPermutations) {
+//            QuerySearchTermsAccumulator termsAccumulator = new QuerySearchTermsAccumulator(basicQuery);
+//
+//            domain = termsAccumulator.domain;
+//
+//            SearchSubquery subquery = termsAccumulator.createSubquery();
+//            subqueries.add(subquery);
+//        }

        List<Integer> domainIds = params.domainIds();

--- a/code/functions/search-query/test/nu/marginalia/functions/searchquery/query_parser/variant/model/QWordGraphTest.java
+++ b/code/functions/search-query/test/nu/marginalia/functions/searchquery/query_parser/variant/model/QWordGraphTest.java
@ -1,4 +1,4 @@
-package nu.marginalia.functions.searchquery.query_parser.variant.model;
+package nu.marginalia.functions.searchquery.query_parser.model;

 import org.junit.jupiter.api.Test;

@ -10,11 +10,13 @@ class QWordGraphTest {

        System.out.println(graph.isBypassed(graph.nodes().get(1), QWord.beg(), QWord.end()));
        System.out.println(graph.isBypassed(graph.nodes().get(2), QWord.beg(), QWord.end()));
+        System.out.println(graph.compileToQuery());
        graph.links().forEach(System.out::println);
        System.out.println("--");
        graph.nodes().forEach(System.out::println);
        System.out.println("--");
        graph.addVariant(graph.nodes().get(1), "sup");
+        System.out.println(graph.compileToQuery());
        System.out.println(graph.isBypassed(graph.nodes().get(1), QWord.beg(), QWord.end()));
        System.out.println(graph.isBypassed(graph.nodes().get(2), QWord.beg(), QWord.end()));
        System.out.println("--");
@ -23,6 +25,8 @@ class QWordGraphTest {
        graph.nodes().forEach(System.out::println);

        graph.addVariantForSpan(graph.nodes().get(1), graph.nodes().get(2), "heyall");
+        graph.addVariant(graph.nodes().get(2), "globe");
+        System.out.println(graph.compileToQuery());
        System.out.println(graph.isBypassed(graph.nodes().get(1), QWord.beg(), QWord.end()));
        System.out.println(graph.isBypassed(graph.nodes().get(2), QWord.beg(), QWord.end()));
        System.out.println("--");