MoE

スポンサーリンク
AI関連

Step 3.5 Flash:196B相当を11Bで動かす超効率LLMの登場

「70B 以上じゃないと精度が足りない。でもそんな GPU 台数、現実的じゃない。」ここ半年くらい、プロダクション導入の相談を受けると、だいたいこの会話から始まります。eval では 8B/13B だとギリギリ70B にすると精度は良いけど...
AI関連

Moonshot AI Kimi K2.5 Open-Source Model Release

「GPT-4 クラスをオンプレで動かしたい。でも、GPU コストと運用の闇を考えると毎回 API に逃げてしまう。」そんな経験、ありませんか?😇US 製 API は高いし、データも全部クラウドに飛ぶ オープンモデルは増えたけど、「結局どれが...
AI関連

Grok 5 リーク情報まとめ

「また新しいフラッグシップ LLM? どうせハイプでしょ?」最近そんな気持ちで AI ニュースをスルーしている人、多いのではないでしょうか。GPT-4.1 だ、Claude 3.5 だ、Gemini 2.0 だ…そのたびに「◯◯ は △△ ...
AI関連

NVIDIA 次世代AIプラットフォーム Rubin 発表

「LLMの推論コスト、もうこれ以上は削れないんじゃないか…」そう感じたこと、ありませんか?ユーザーは「精度落とさずにもっと安く・もっと速く」を当然のように要求する経営は「AIは重要。でもインフラ費がクラウド代を圧迫しすぎ」と渋い顔エンジニア...
AI関連

NVIDIA 次世代AIプラットフォーム『Rubin』発表

「LLMの推論コスト、クラウド代がシャレにならないんだけど…」そう感じたこと、ありませんか?GPU を増やしてスループットは上がる。でも請求書も一緒に指数関数的に伸びる。モデルは回るけど、事業としてペイしない。この「AIインフラ版レッドオー...
AI関連

NVIDIAがオープンソースLLM「Nemotron 3」を発表

「LLMなに使うか会議」、毎回揉めてませんか?MetaのLlamaにするか、DeepSeekにするか、はたまたクラウド専用モデルに寄せるか…。その裏で、「どうせ全部NVIDIA GPUで動かすんだから、純正モデル出してくれよ」と内心思ったこ...
AI関連

NVIDIA、オープンソースLLM『Nemotron 3』発表

「Llama 使うのが“無難”なのは分かってるんだけど、・ライセンスの将来がなんか不安・ベンチマークも最近パッとしない・それでも他に“これだ”っていう OSS LLM もない…」そんなモヤモヤを抱えたまま、GPU クラスタの請求書だけが積み...
スポンサーリンク