フィードを購読する

本日 Red Hat は、 Red Hat Enterprise Linux AI (RHEL AI) の開発者プレビューを発表しました。これは、最高水準のオープンソースの Granite 生成 AI モデルをシームレスに開発、テスト、実行するための基盤モデルプラットフォームであり、エンタープライズ・アプリケーションを強化するものです。RHEL AI は InstructLab オープンソース・プロジェクトをベースとし、IBM Research からオープンソースライセンスされた Granite 大規模言語モデルと、LAB (Large-scale Alignment for chatBots) 手法に基づく InstructLab モデルアライメントツールを、最適化されたブート可能な RHEL イメージに組み合わせ、サーバーのデプロイメントを単純化することを目的としています。

RHEL AI と InstructLab プロジェクトの主な目的は、専門家が 知識スキルによって大規模言語モデルに直接貢献できるようにすることです。これにより、専門家は AI を取り入れたアプリケーション (チャットボットなど) をより効率的に構築することができます。RHEL AI は、以下によって必要なものをすべて組み込むことができます。

  • オープンソースモデルによるコミュニティのイノベーションを活用し、オープンソースのスキルと知識をトレーニングに活用する。
  • 使いやすいソフトウェアツールおよびワークフローの一式を提供し、データサイエンス経験のない専門家がトレーニングとファインチューニングを行えるようにする。
  • 最適化された AI ハードウェア対応のパッケージ化されたソフトウェアとオペレーティングシステムを活用する。
  • エンタープライズ向けサポートと知的財産の補償

背景

大規模言語モデル (LLM) とこれをベースとするサービス (GPT や chatGPT など) はよく知られており、企業組織での導入が増えています。これらのモデルはほとんどの場合、オープンソースではなく、カスタムライセンスによって提供されます。最近では、多くのオープンモデルが登場しています (Mistral、Llama、OpenELM など)。しかし、これらのモデルの中には、オープン性が制限されているものもあります (たとえば、商用利用の制限や、トレーニングデータや Transformer の重み、再現性に関連するその他の要因に関するオープン性の欠如など)。おそらく最も重要な要因は、コミュニティが協力してモデルを改良するために貢献できる方法がないことが考えられます。

最新の LLM は大規模で汎用性があります。Red Hat は、データのプライバシー、主権、機密性を最重要視する世界クラスの MLOps ツールに囲まれる中、コストとパフォーマンスを最適化した専用モデルの世界を構想しています。

LLM をファインチューニングするためのトレーニングパイプラインには、データサイエンスの専門知識が必要であり、トレーニング用のリソース使用量と高品質のトレーニングデータのコストの両面で、費用がかかる可能性があります。

Red Hat は (IBM およびオープンソース・コミュニティと共に) この点についての変革を提案します。Red Hat は、オープンソースのコントリビューターのワークフローと、パーミッシブライセンス (Apache2 など) のような関連する概念を、ユーザーのコミュニティが LLM に貢献できるようにするオープンコラボレーションのためのモデルやツールに導入することを提案します。また、これによりパートナーのエコシステムが強化され、企業による保護された情報の拡張や組み込みを可能にするオファリングと価値が実現します。

Red Hat Enterprise Linux AI の導入!

Red Hat Enterprise Linux AI は、次の 4 つの基盤コンポーネントで構成されています。

1.  オープンな Granite モデル

RHEL AI には、InstructLab コミュニティが共同開発した、高性能でオープンソースライセンスの Granite 言語とコードモデルが含まれ、これらは、Red Hat によって完全にサポートされ、補償されます。これらの Granite モデル は Apache 2 ライセンスであり、データソースとモデルの重みへの透過的なアクセスを提供します。

ユーザーは、自分のスキルと知識を使ってベースモデルをトレーニングすることで、独自のカスタム LLM を作成できます。ユーザーは、トレーニングされたモデルや追加されたスキルと知識をコミュニティと共有するか、非公開にするかを選択できます。これについては、次のセクションで詳しく説明します。

開発者プレビューの場合、ユーザーは Granite 7b の英語モデル (ベースモデル)と、それに対応する Granite 7b の LAB モデルにアクセスできます (LAB の詳細は以下を参照してください)。

将来的には、Red Hat Enterprise Linux AI には、Granite コードモデルファミリーを含む、追加の Granite モデルも含まれる予定です。詳細の発表までお待ちください。

2. InstructLab モデルのアライメント

LAB: Large-Scale Alignment for ChatBots は、高品質の合成データ生成を活用した分類法主導のアプローチで、大規模言語モデルのインストラクションアライメントとファインチューニングを行う新しいアプローチです。簡単に言えば、これは、ドメイン固有の知識とスキルを持つ LLM をカスタマイズすることができます。その後、InstructLab は LLM のトレーニングに使用される高品質の合成データを生成します。さらに、忘却を防ぐために再生バッファが使用されます。詳細については、この学術論文のセクション 3.3を参照してください。

LAB 技術には 4 つの明確な手順があります (図を参照)。

  • 分類法に基づいたスキルと知識の表現
  • 教師モデルによる合成データ生成 (SDG)
  • 批評家モデルによる合成データの検証。
  • 生徒モデルの上でのスキルと知識のトレーニング
RHEL AI Large-scale Alignment for ChatBots

InstructLab は、LAB 技術を実装したソフトウェアの名前です。ユーザーが追加した新しいものも含め、スキルと知識のローカル git リポジトリと対話するコマンドラインインターフェースで構成され、合成データを生成し、LLMのトレーニングを実行し、トレーニングされたモデルを提供し、チャットします。

開発者プレビューでは、InstructLab は a) スキルと知識を追加するための git ワークフロー、b) 合成データを生成するための教師モデルとしての Mixtral、c) 段階的なトレーニングのための deepspeed、d) 推論サーバーとしての vllm を使用しています。それに加えて、このツールは、人間によるレビューとフィードバックを可能にするゲートを提供しています。Red Hat では、将来的には、より簡単かつスケーラブルにするために、さらに多くのツールの追加に取り組んでいます。他のオープンソース・プロジェクトと同様に、皆様もご参加いただき、今後の方向性の舵取りを支援していただくことができます。

InstructLab は、Red Hat が IBM Research との共同で開始したオープンソース・コミュニティ・プロジェクトの名前です。コミュニティプロジェクトは、コミュニティメンバーによって管理されている、公開された Apache 2.0 ライセンスの分類法に貢献をまとめています。LAB のトレーニングされたモデルは定期的にコミュニティにリリースされ、そのモデルにはコミュニティによるタクソノミーの貢献が含まれています。

RHEL AI blog image 2

3. Granite モデルと InstructLab 向けに最適化されたブート可能な Red Hat Enterprise Linux

前述の Granite モデルおよび InstructLab ツールは、AMD、Intel、NVIDIA などのベンダーの一般的なハードウェア・アクセラレーター用に最適化されたソフトウェアスタックを備えた、 ブート可能な RHEL イメージ上にダウンロードされ、デプロイされます。さらに、これらの RHEL AI イメージは、パブリッククラウド (開発者プレビューで検証された IBM Cloud) や、Dell、Cisco、HPE、Lenovo、SuperMicro の AI 最適化サーバーなど、Red Hat 認定エコシステム全体で起動し、実行されます。Red Hat の初期テストによると、InstructLab のエンドツーエンド実行を妥当な時間内に完了するには、320GB の VRAM (4 X NVIDIA H100 GPU) または同等のもの が必要です。

RHEL AI blog image 3

4. 企業向けサポート、ライフサイクル、補償

一般提供 (GA) 時点で、Red Hat Enterprise Linux AI サブスクリプションには、エンタープライズサポート、Granite 7B モデルとソフトウェアで始まる完全な製品ライフサイクル、Red Hat による IP (知的財産) の補償が含まれます。

開発者プレビューの場合、Red Hat Enterprise Linux AI はコミュニティサポートであり、Red Hat のサポートや補償はありませんのでご注意ください。

実験からプロダクションへ

ここでは、段階的な 3 ステップのアプローチにより、最初の本番環境へのデプロイを開始し、大規模な本番環境にデプロイする方法について説明します。

  • ステップ 1: オープンソースの InstructLab CLI を使用してラップトップ (またはデスクトップ) で開始できます。これにより、InstructLab に慣れ、低忠実度のモデル (qlora) をスキルと知識を追加して生成できます。
  • ステップ 2: Red Hat Enterprise LInux AI をベアメタルサーバー、オンプレミスまたはクラウド内の仮想マシンで起動できます。InstructLab を使用して、スキルと知識のコーパスを追加し、トレーニングにより高忠実度の、トレーニングとチューニング済みのモデルを作成し、アプリケーションとチャットしたり、統合したりできます。
  • ステップ 3: 大規模な本番環境の場合は、上記と同じ方法 (RHEL AI を使用) を使用できますが、OpenShift AI を使用すると、トレーニングを複数のノードに分散して完了までの時間を迅速化し、スループットを向上できるというメリットが加わります。 さらに、OpenShift AI を使用すると、トレーニング済みのモデルを本番環境のクラウドネイティブ・アプリケーションと統合することがはるかに容易になります。
RHEL AI blog image 4

まとめ

Red Hat は、IBM、オープンソース・コミュニティおよびパートナーと協力して、オープンソースのイノベーションとコラボレーションの力を大規模言語モデルおよびオープン・エンタープライズ・ソフトウェアに、そして企業や組織にもたらすという素晴らしい道のりを進んでいます。Red Hat では、これは始まりにすぎず、この先には多くのチャンスが広がっていると考えています。

皆様もぜひ、その取り組みに参加してください。Red Hat のオープンソース・コミュニティに参加してください。皆様の貢献に感謝します。

オープンソースの Granite モデルのトレーニングを開始するには、 InstructLab CLI をラップトップまたはデスクトップにダウンロードするか、または RHEL AI 開発者プレビューに移動してください。開発者プレビューについてサポートが必要な場合は、 [email protected] までご連絡ください。

参考資料


執筆者紹介

A 20+ year tech industry veteran, Jeremy is a Distinguished Engineer within the Red Hat OpenShift AI product group, building Red Hat's AI/ML and open source strategy. His role involves working with engineering and product leaders across the company to devise a strategy that will deliver a sustainable open source, enterprise software business around artificial intelligence and machine learning.

Read full bio
UI_Icon-Red_Hat-Close-A-Black-RGB

チャンネル別に見る

automation icon

自動化

テクノロジー、チームおよび環境に関する IT 自動化の最新情報

AI icon

AI (人工知能)

お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート

open hybrid cloud icon

オープン・ハイブリッドクラウド

ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。

security icon

セキュリティ

環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報

edge icon

エッジコンピューティング

エッジでの運用を単純化するプラットフォームのアップデート

Infrastructure icon

インフラストラクチャ

世界有数のエンタープライズ向け Linux プラットフォームの最新情報

application development icon

アプリケーション

アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細

Virtualization icon

仮想化

オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください