RAG

スポンサーリンク
AI関連

NVIDIA 次世代AIプラットフォーム『Rubin』発表

「LLMの推論コスト、クラウド代がシャレにならないんだけど…」そう感じたこと、ありませんか?GPU を増やしてスループットは上がる。でも請求書も一緒に指数関数的に伸びる。モデルは回るけど、事業としてペイしない。この「AIインフラ版レッドオー...
AI関連

Context Management 2025 連載シリーズ公開

「RAGを足せば何とかなる」と思っていたLLMアプリ、気づいたらコードが地獄のように絡み合っていませんか?プロンプトの周りにRAG、メモリ、ツール呼び出し、ユーザ状態、ポリシーチェック…全部ごちゃ混ぜ。「どこを直せばこのバグが直るのか誰も説...
AI関連

Duplicate article: ゼロから作るLLM Part4: GPT-2の実装

「transformers の中身、結局よく分かってないな…」とモヤモヤしたこと、ありませんか?モデルは呼べる。Fine-tune もなんとなくできる。でも「中で何が起きてるか説明して」と言われた瞬間に手が止まる——あの感じです。そんなとこ...
AI関連

note発・国家プロジェクトGENIACとRAGデータエコシステム始動

「RAGでサービス作りたいけど、日本語コンテンツを合法的に使えるまともなデータソースがない…」そう嘆いたこと、ありませんか? 僕はあります。何度も。スクレイピングはグレー、出版社との個別交渉は重すぎる、かといってWikipediaだけじゃ精...
AI関連

Google DeepMind 2025 AI Breakthroughs Year in Review

「またエージェントフレームワーク増えたの?」「マルチモーダル用に別モデル立てるの、そろそろやめたいんだけど…」そんなことを思いながら、LLMまわりのアーキ図を更新するたびにため息ついていませんか?🤯 2025年の Google DeepMi...
AI関連

DeepSeek v3.2 Detailed Technical Overview

「GPT‑4 クラスを安く回したい。でも 3.5 だと精度が足りないし、4 はお財布が死ぬ」そんなジレンマで悩んだこと、ありませんか?エージェントや RAG を本気で組み始めると、「推論が弱いと全部グダグダになる」くせに、まともな推論をする...
AI関連

Google Gemini 3 Flash Release and Free Availability

「LLMの料金レポート、見るたびに気が重くなるんだよね…」そんな経験、ありませんか?トークン課金を気にしてプロンプトを削ったり、PoCなのにコスト試算表を作らされたり。正直、「とりあえずガンガン叩いて試す」がやりづらいのが、ここ1〜2年のA...
AI関連

NVIDIAがオープンソースLLM「Nemotron 3」を発表

「LLMなに使うか会議」、毎回揉めてませんか?MetaのLlamaにするか、DeepSeekにするか、はたまたクラウド専用モデルに寄せるか…。その裏で、「どうせ全部NVIDIA GPUで動かすんだから、純正モデル出してくれよ」と内心思ったこ...
AI関連

NVIDIA、オープンソースLLM『Nemotron 3』発表

「Llama 使うのが“無難”なのは分かってるんだけど、・ライセンスの将来がなんか不安・ベンチマークも最近パッとしない・それでも他に“これだ”っていう OSS LLM もない…」そんなモヤモヤを抱えたまま、GPU クラスタの請求書だけが積み...
AI関連

Gemini 3 リリースまとめ

「Gemini 1.5 でエージェントを組んだら、・ツール呼び出しはたまに無視される・長文 PDF は読めるけど要約が怪しい・プロンプトはモデルの機嫌との戦い…こんなこと、経験ありませんか?」正直、ここ1〜2年、LLM周りの「イライラ」はほ...
スポンサーリンク