エンタープライズ言語モデル:ビジネスニーズに合った適切なアプローチの選択

0
読了時間
エンタープライズ言語モデル:ビジネスニーズに合った適切なアプローチの選択
Glean Icon - Circular - White
GleanによるAIサマリー
  • 本番環境で言語モデルを使用するには、主にクローズドソースプロバイダーのAPIを使用するか、オープンソースモデルをホストするかの2つの選択肢があり、それぞれに長所と短所があります。
  • クローズドソースAPIはセットアップが容易でメンテナンスも少ないものの、セキュリティ、柔軟性、価格面での懸念があります。一方、オープンソースモデルでは制御とカスタマイズが容易ですが、技術的な専門知識とインフラストラクチャが必要です。
  • 多くの場合、企業はテストとイテレーションのためにクローズドソースモデルから始め、アイデアが製品市場に適合するようになったら、オープンソースモデルまたは社内モデルに移行して、使いやすさと長期的な持続可能性のバランスを取ります。

言語モデルは、私たちが知識や情報を扱う方法に革命をもたらしました。チャットボットからテキスト要約まで、 幅広いエンタープライズアプリケーション 私たちの働き方を変えることができます。

ただし、利用できるプロバイダーやモデルが非常に多いため、適切なアプローチを選択するのは大変です。ここで急いでいると、イテレーションのスピードや、セキュリティに敏感な企業顧客からの潜在的な取引という点でコストがかかる可能性があります。このブログでは、本番環境で言語モデルを使用する際の 2 つの主なオプションと、それぞれのオプションの長所と短所について説明します。

誰もが楽しめる何か

オプションを説明する前に、すべての言語モデルが同じように作られているわけではないことに注意することが重要です。一部のモデルは他のモデルよりも特定のタスクに適しており、予測の質はプロバイダーによって大きく異なります。機械学習の研究の多くはオープンソースで入手可能ですが、これらのプロバイダーが独自の技術、つまり「秘訣」に固執するビジネス上の大きなインセンティブがあります。

さまざまなモデルの品質を比較するには、スタンフォードのようなベンチマーク HELM (言語モデルの総合的評価) 役に立つかもしれません。HELMは、さまざまなプロバイダーによって構築された大規模言語モデル(LLM)を共通のタスクとメトリクスのセットに基づいて評価し、パフォーマンスを比較するための標準化された方法を提供します。もちろん、モデルをテストする最善の方法は、自分のニーズと要件に合った独自の評価と指標を構築することです。

ユースケースに適したモデルを特定したら、それを本番環境で使用するための2つの選択肢があります。クローズドソースプロバイダーのAPIを使用するか、オープンソースモデルをホストするかです。

オプション 1 — クローズドソースプロバイダーの API を使用する

のようなクローズドソースプロバイダー オープンAIまとまりがある、および アントロピック API のサブスクリプションを通じて言語モデルへのアクセスを提供します。手順は簡単です。プロバイダーにサインアップすると、そのプロバイダーの API にアクセスできるようになります。これで、API にテキストを送信してレスポンスを受け取ることができます。ユーザーは通常、入力と出力の長さに基づいて課金されます。

長所:

  1. セットアップのしやすさ —このオプションでは、インフラストラクチャや独自のメンテナンスを必要としません。API はモデルにアクセスするための標準化された方法を提供し、統合を容易にし、導入を容易にします。
  2. 付帯条件なし — クラウドソース API に関しては、お客様側の投資は最小限で済みます。さまざまなLLMを継続的に比較し、別のプロバイダーがユースケースに適したものを提供してくれれば、すぐに環境に優しい牧草地に移ることができます。
  3. メンテナンス頻度が低いか、まったく必要ありません — LLM をセットアップして活用するのに ML Ops のノウハウを社内で必要としないため、時間とコストを節約でき、悩みの種にもなりません。

短所:

  1. セキュリティとプライバシー — データを第三者に送信する場合、データが漏洩するリスクがあります。また、機密情報が第三者のモデルのトレーニングや改善に使用されることもあります。法人のお客様の場合、このオプションは売りにくいかもしれません。
  2. 柔軟性の欠如 —クローズドソースモデルは、カスタマイズが難しいと同時に、微調整に目を見張るほどコストがかかることがよくあります。これは、アプリケーションの専門性によって問題になる場合とそうでない場合があります。たとえば、どの標準LLMでも、テキストを英語またはスペイン語に分類できるはずです。ただし、カスタムデータに固有のテキスト分類機能を構築する場合(ユーザーコマンドを音声アシスタントの内部スキーマに分類するなど)、モデルを微調整する必要がある場合があります。
  3. 価格設定 —サブスクリプションの費用は完全にプロバイダーの裁量に委ねられ、プロバイダーのSLAと価格スキームの対象となります。規模が大きくなると、クローズドソースのソリューションは、社内でホストされているモデルよりもはるかに高価になる可能性があります。
  4. 製品の防御性 — クローズドソースのソリューションを導入することで、競合他社が貴社の製品のアプローチや市場での差別化をより簡単に真似できるようになります。AIの使用が製品のコア強みである場合、これはかなり懸念されるかもしれません。

オプション 2 — オープンソースモデルをホストする

のようなオープンソースモデル ハギング・フェイス・ブルームメタラマ、および グーグルフラン-T5 誰でも自由に使用できます。ただし、お客様に代わってモデルをホストし、API ベースのアクセスを提供するソリューションまたは企業 (例: ハグフェイス そして 複製)はまだ始まったばかりなので、自分でホストしなければならないことがよくあります。クローズドソースモデルの長所と短所は、オープンソースモデルを選択した場合、ほぼ(予想通り)逆になります。

長所:

  1. セキュリティとプライバシー — モデルを自分でホストすることで、データとその処理方法を完全に制御できます。データプライバシーに関心を持つ潜在的な顧客は、この見込み客の方がはるかに魅力的だと感じるかもしれません。
  2. さらなる柔軟性 —特定のユースケースに合わせてモデルをカスタマイズおよび微調整するのがはるかに簡単になり、より専門的なアプリケーションが可能になり、突然のニーズに迅速に対応できるようになります。
  3. 価格設定 — 使用量のスループットが高く、スケーリングが懸念される場合は、長期的にはこのオプションの方がはるかに手頃な場合があります。
  4. 製品の防御性 —それはあなたのモデルであり、あなただけのものです。特定のユースケースに合うように「シークレットソース」を継続的に自由に調整できるため、製品の模倣が難しくなり、競合に対する耐性が高まります。

短所:

  1. 難しいセットアップ —モデルを自分でホストするには、より多くの技術的専門知識とインフラストラクチャが必要になり、セットアップと統合に時間と労力がかかり、複雑になります。
  2. モデルのアップグレード —必要なすべてのアップグレードは、社内で構築する必要があります。結局は高価でトリッキーなことになるかもしれません。
  3. 社内機械学習要件 — モデルや MLOP の微調整のノウハウを持つ専任の専門家を配置する必要があります。また、新入社員の離職率や新人研修によって、進捗状況やスピードに影響が出る可能性があります。

あなたに最適なものを見つけましょう

各モデルは、パラメーターの数とトレードオフが異なります。モデルが小さいほど安価で管理が容易ですが、品質の低下を予測できる可能性があります。そのため、企業は多くの場合、アイデアのテストと反復のためにクローズドソースモデルから始め、それらのアイデアが製品市場に適合すると判断したら、オープンソースモデルまたは社内モデルに移行します。

とにかく、すべての人のユースケースとニーズに合ったモデルがあります。この分野は、テクノロジーとビジネスモデルの両面で急速に進歩しています。そのため、今後選択できる選択肢が増えることを期待してください。

Glean では、これらのアプローチを最適に組み合わせて、ユーザーが実装に苦労することなく優れた製品体験を楽しめるようにしています。Glean の詳細と実際の動作を確認するには、サインアップしてください 今日のデモ!

Work AI for All.

デモに申し込む
CTA BG