RAG

スポンサーリンク
AI関連

グーグル、Gmailの大幅アップデートでAI全面導入

朝イチでGmailを開いた瞬間、こう思ったことはありませんか?「どのメールから処理すればいいのか分からない…」「結局、重要なのは3通だけなのに、100通読む羽目になってる…」正直、ここ10年以上、メールクライアントって「多少速くなったOut...
AI関連

xAIがシリーズEで200億ドル調達、評価額34兆円に

「また OpenAI 依存のアーキテクチャか…」って、設計ドキュメントを書きながらため息をついたこと、ありませんか?ベストプラクティスも SDK もサンプルも全部 GPT 前提。でも心のどこかで「この一極集中、いつか逆襲されるよな…」と感じ...
AI関連

NVIDIA 次世代AIプラットフォーム『Rubin』発表

「LLMの推論コスト、クラウド代がシャレにならないんだけど…」そう感じたこと、ありませんか?GPU を増やしてスループットは上がる。でも請求書も一緒に指数関数的に伸びる。モデルは回るけど、事業としてペイしない。この「AIインフラ版レッドオー...
AI関連

Context Management 2025 連載シリーズ公開

「RAGを足せば何とかなる」と思っていたLLMアプリ、気づいたらコードが地獄のように絡み合っていませんか?プロンプトの周りにRAG、メモリ、ツール呼び出し、ユーザ状態、ポリシーチェック…全部ごちゃ混ぜ。「どこを直せばこのバグが直るのか誰も説...
AI関連

Duplicate article: ゼロから作るLLM Part4: GPT-2の実装

「transformers の中身、結局よく分かってないな…」とモヤモヤしたこと、ありませんか?モデルは呼べる。Fine-tune もなんとなくできる。でも「中で何が起きてるか説明して」と言われた瞬間に手が止まる——あの感じです。そんなとこ...
AI関連

note発・国家プロジェクトGENIACとRAGデータエコシステム始動

「RAGでサービス作りたいけど、日本語コンテンツを合法的に使えるまともなデータソースがない…」そう嘆いたこと、ありませんか? 僕はあります。何度も。スクレイピングはグレー、出版社との個別交渉は重すぎる、かといってWikipediaだけじゃ精...
AI関連

Google DeepMind 2025 AI Breakthroughs Year in Review

「またエージェントフレームワーク増えたの?」「マルチモーダル用に別モデル立てるの、そろそろやめたいんだけど…」そんなことを思いながら、LLMまわりのアーキ図を更新するたびにため息ついていませんか?🤯 2025年の Google DeepMi...
AI関連

DeepSeek v3.2 Detailed Technical Overview

「GPT‑4 クラスを安く回したい。でも 3.5 だと精度が足りないし、4 はお財布が死ぬ」そんなジレンマで悩んだこと、ありませんか?エージェントや RAG を本気で組み始めると、「推論が弱いと全部グダグダになる」くせに、まともな推論をする...
AI関連

Google Gemini 3 Flash Release and Free Availability

「LLMの料金レポート、見るたびに気が重くなるんだよね…」そんな経験、ありませんか?トークン課金を気にしてプロンプトを削ったり、PoCなのにコスト試算表を作らされたり。正直、「とりあえずガンガン叩いて試す」がやりづらいのが、ここ1〜2年のA...
AI関連

NVIDIAがオープンソースLLM「Nemotron 3」を発表

「LLMなに使うか会議」、毎回揉めてませんか?MetaのLlamaにするか、DeepSeekにするか、はたまたクラウド専用モデルに寄せるか…。その裏で、「どうせ全部NVIDIA GPUで動かすんだから、純正モデル出してくれよ」と内心思ったこ...
スポンサーリンク