RAG - AIテックニューストゥデイ

NVIDIA 次世代AIプラットフォーム『Rubin』発表

「LLMの推論コスト、クラウド代がシャレにならないんだけど…」そう感じたこと、ありませんか？GPU を増やしてスループットは上がる。でも請求書も一緒に指数関数的に伸びる。モデルは回るけど、事業としてペイしない。この「AIインフラ版レッドオー...

2026.01.06

AI関連

「RAGを足せば何とかなる」と思っていたLLMアプリ、気づいたらコードが地獄のように絡み合っていませんか？プロンプトの周りにRAG、メモリ、ツール呼び出し、ユーザ状態、ポリシーチェック…全部ごちゃ混ぜ。「どこを直せばこのバグが直るのか誰も説...

2026.01.01

AI関連

「transformers の中身、結局よく分かってないな…」とモヤモヤしたこと、ありませんか？モデルは呼べる。Fine-tune もなんとなくできる。でも「中で何が起きてるか説明して」と言われた瞬間に手が止まる——あの感じです。そんなとこ...

2025.12.28

AI関連

「RAGでサービス作りたいけど、日本語コンテンツを合法的に使えるまともなデータソースがない…」そう嘆いたこと、ありませんか？僕はあります。何度も。スクレイピングはグレー、出版社との個別交渉は重すぎる、かといってWikipediaだけじゃ精...

2025.12.25

AI関連

「またエージェントフレームワーク増えたの？」「マルチモーダル用に別モデル立てるの、そろそろやめたいんだけど…」そんなことを思いながら、LLMまわりのアーキ図を更新するたびにため息ついていませんか？🤯 2025年の Google DeepMi...

2025.12.24

AI関連

「GPT‑4 クラスを安く回したい。でも 3.5 だと精度が足りないし、4 はお財布が死ぬ」そんなジレンマで悩んだこと、ありませんか？エージェントや RAG を本気で組み始めると、「推論が弱いと全部グダグダになる」くせに、まともな推論をする...

2025.12.23

AI関連

「LLMの料金レポート、見るたびに気が重くなるんだよね…」そんな経験、ありませんか？トークン課金を気にしてプロンプトを削ったり、PoCなのにコスト試算表を作らされたり。正直、「とりあえずガンガン叩いて試す」がやりづらいのが、ここ1〜2年のA...

2025.12.18

AI関連

「LLMなに使うか会議」、毎回揉めてませんか？MetaのLlamaにするか、DeepSeekにするか、はたまたクラウド専用モデルに寄せるか…。その裏で、「どうせ全部NVIDIA GPUで動かすんだから、純正モデル出してくれよ」と内心思ったこ...

2025.12.17

AI関連

「Llama 使うのが“無難”なのは分かってるんだけど、・ライセンスの将来がなんか不安・ベンチマークも最近パッとしない・それでも他に“これだ”っていう OSS LLM もない…」そんなモヤモヤを抱えたまま、GPU クラスタの請求書だけが積み...

2025.12.16

AI関連

「Gemini 1.5 でエージェントを組んだら、・ツール呼び出しはたまに無視される・長文 PDF は読めるけど要約が怪しい・プロンプトはモデルの機嫌との戦い…こんなこと、経験ありませんか？」正直、ここ1〜2年、LLM周りの「イライラ」はほ...

2025.12.16

AI関連