- Gleanのオートコンプリート機能は、クエリの提案、ドキュメント、構造化された結果などのさまざまなコンテンツタイプを表示することで、ほぼゼロの遅延候補を提供し、ユーザーエクスペリエンスを向上させることを目的としています。
- チームは、インデックス化されたドキュメントからクエリをマイニングし、関連するドキュメントを提案するためのユーザーのニーズを予測し、プライバシー、翻訳、クエリのランク付けなどの課題に対処することに重点を置いています。
- オートコンプリートシステムの継続的な改善により、ユーザーの摩擦が大幅に軽減され、結果のクリック数の顕著な割合がオートコンプリート候補からのものでした。
オートコンプリートは、ユーザーが行きたい場所に誘導するための支援検索機能です。 もっと早く、ユーザーがクエリを作成するときに直接アクセスできるように潜在的なクエリまたはドキュメントを提案します。Glean は、クエリの提案、ドキュメント、オペレータ、人物やチームなどの構造化された結果など、さまざまな種類のコンテンツを表示できます。コンテンツタイプごとに、検索を迅速に行うための独自の方法がユーザーに提供されます。
ドロップダウンに何を表示しても、変わらないことが1つあります。それは、ユーザーが入力するときに、これらの結果をほぼゼロの遅延で表示したいということです。キーストロークのたびに検索を実行することはできないため(遅延がほぼゼロの要件を満たさないため)、 Glean 検索機能チームは、スムーズなエクスペリエンスを実現するために、オートコンプリートをゼロから構築しました。現在、オートコンプリートはすでに、満足度を得るまでの平均時間を 40% 短縮するのに役立っています。このブログ記事では、迅速で有用な提案を行うことに関連する技術的な課題、これまでに得た成功、およびチームが取り組んでいる開発分野について説明します。
「スモールデータ」向けのクエリ候補の作成
オープンウェブ上で最も馴染みのあるオートコンプリートの形式は、ユーザーの入力時に候補となるクエリを提案することです。クエリの候補は、2 つの点でユーザーに役立ちます。1) クエリ全体を入力しなくても済むため、ユーザーの時間を節約でき、2) 最終的に探している情報が得られる可能性が高い (より適切な) クエリをユーザーが作成できるようにする。
公開されている検索エンジンの標準的な手法は、膨大なクエリ量を活用してクエリの候補を生成することです。たとえば、10万人以上のユニークユーザーからクエリが発行されたら、そのクエリをパブリックサジェストとしてマークするエンジンがあります。これは、エンジンのユーザー数が1億人を超える場合はかなり妥当なしきい値です。
残念ながら、エンタープライズ環境に適用したのと同じ手法では不十分です。ほとんどの企業の従業員数は合計で10万人よりはるかに少なく、企業からの問い合わせが繰り返される可能性は、パブリックWebと比較して経験的に約3倍低くなります。少ないクエリ量から候補を生成することは確かに可能ですが、システムは質の高いクエリ候補をそれほど多く生成できず、最悪の場合、プライバシーを侵害する提案になることさえあります。さらに、新しい顧客とのローンチを行うたびに、次のような問題が発生します。」コールドスタート問題」: このようなシステムでは、有用な推論を導き出すのに十分なユーザーの行動に関する情報がまだありません。
代わりに Glean では、すでに索引付けされているドキュメントからクエリをマイニングすることに重点を置いてきました。このアプローチは上記の問題のいくつかを回避しますが、課題がないわけではありません。まず、機密情報が漏洩しないように、マイニングされたクエリは権限を認識している必要があります。さらに、ドキュメントで使用されている言語が必ずしも適切なクエリになるとは限らないため、ドキュメント言語をクエリ空間に翻訳する必要があります。そして最後に、システムが扱いやすい一連の提案をユーザーに返せるように、マイニングされたクエリにスコアを付けて互いにランク付けする必要があります。翻訳とスコアリングはどちらも未解決の問題であり、検索機能チームは引き続き取り組んでいます。それぞれがクエリ候補の全体的な品質にとって重要だからです。
スマートドキュメント提案
25% のユーザーが Glean して、ドキュメントにすばやく移動したい 彼らは知っている 存在するもの:現在取り組んでいるタスク、先週読んだことを覚えている文書、または最近発表された会社の全員参加の資料など。オートコンプリートチームには、Enter キーを押さなくても、探していたドキュメントをユーザーに表示することで、優れたユーザーエクスペリエンスを実現するまたとない機会を得ました。
エンタープライズ環境ではドキュメントスペースが比較的小さいため、オートコンプリートからユーザーを直接ドキュメントに移動できます。Glean Searchやクエリ候補と同様に、各ドキュメントの基本的な権限を尊重し、すでにアクセス権があるユーザーにのみドキュメントを提案するようにしています。
一方、ドキュメントスペースが小さいからといって、ユーザーが探している正確なドキュメントをシステムが簡単に見つけられるわけではありません。ユーザーはオートコンプリートがほぼ瞬時に行われることを期待しているため、Glean Searchが最も有用な結果を見つけるために実行できる計算をすべてシステムに実行することはできません。これらの要求を満たすために、ユーザーが次にアクセスするドキュメントを予測する低レイテンシーモデルを開発しました。ユーザーが入力するにつれて、入力をセット内の各ドキュメントから抽出されたキーワードと照合することで、予測ドキュメントセットをさらにフィルタリングしてランク付けします。このステップは、うるさくて説明が難しい提案がユーザーに伝わるのを防ぎます。
それでも、予測セット内の複数の文書に類似のキーワードが含まれることがよくあります。ユーザーがProject Xにスタッフを配置している場合、セット内のほとんどのドキュメント、チケット、プレゼンテーションの先頭に「Project X:」が付いている可能性があります。さらに、ほとんどのユーザーは、リストの最初のいくつかの提案だけを見る傾向があります。したがって、このリストの最適なランキングを作成することは、非常に重要かつ困難な作業になります。
幸いなことに、文書の提案を正しく行えば、ユーザーの煩わしさを大幅に減らすことができます。現在、リザルトクリックのほぼ 5 分の 1 がオートコンプリートによるものであることがわかりました。反対に、ドキュメントの提案を見たユーザーの約半数がそれをクリックしています。まだ長い道のりがあります。
オートコンプリート機能の向上とは、法人のお客様にとってより迅速に検索できることを意味します。Glean では、オートコンプリートシステムの改善を常に目指しています。ランキングとパフォーマンスの交差点に興味がある場合は、お問い合わせください Glean 採用情報!また、強力なワークプレース検索がチームに必要なもののように思えるなら、 デモをリクエストする。






