なぜRAGを学んだか RAGという技術を知り、検索の仕組みにもこうした手法が使われていることに興味を持ったのがきっかけ。自分でもRAGを活用した検索アプリを作ってみたいと思った。 とりあえず、基礎から応用まで網羅してるRAGの教材を読み込んだ。ボリュームはかなりあった。 読む前の自分の理解はこの程度。 ドキュメ...
English | Français | Español | Català | Italiano | Português | Deutsch | Dansk | Suomi | Nederlands | Polski | Čeština | Slovenčina | Ελληνικά | Русский | Українська | Magyar | Türkçe | Қазақша | עברית | العربية | فارسی | Tiếng Việt | ไทย | Indonesia | Tagalog | বাংলা | हिंदी | 简体中文 | 正體中文...
はじめに それをチェックする☯README.txtheader & cover art by 星 拳五Vaporwaveは資本主義への批評である——この解釈はジャンルの名称を定義した当事者自身によって明確に否定されている。批評家による事後的な理論付けに過ぎなかったのだ。 Macintosh Plusの『Floral Shoppe』がすべての始まりだった——これも正確では...
導入:なぜ今「正体」なのか これまで第二連載では、 PDF取得 LlamaParse整形 構造検査 Vision-Guided Chunking 文書理解レイヤー といったテーマを扱ってきました。 振り返ってみると、やってきたことはすべて「前処理」に関する話でした。 チャンクの話も、パースの話も、構造の話も、どれも検索の前段にある工程です...
はじめに RAGの検索精度が悪い原因、実は「チャンク分割」にあるかもしれません。本記事を読めば、その根本原因を理解した上で、Difyですぐに使えるプロンプトとコードの実装手順が分かります。 ドキュメントを小さなチャンク(断片)に分割してベクトル化するのがRAGの基本ですが、分割した瞬間に「これは何の情報なの...
Naive RAG vs 進化系RAGを実装で比較してみた 〜Query Rewrite / Multi-Query / HyDE / Rerank の性能差の測る〜 はじめに ルミナイR&Dチームの権藤です。 近年、LLM活用の現場では RAG(Retrieval-Augmented Generation) が前提技術になりつつあります。 一方で、「とりあえずEmbeddingして検索すればOK」「Naive RAG...
2019年にスタートした本連載「Innovative Tech」は、世界中の幅広い分野から最先端の研究論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。X:@shi...
【超図解】RAGを「9人の社員がいる普通のオフィス」に例えたら、技術書を100冊読むより構造が理解できた話。——エンジニアの専門用語が"翻訳"できる「脳内地図」【第1章:全体像編】 【連載:RAG商事の盛衰】 第1章:本記事 第2章:【超実録】RAGの「魔法」は、地下室の「泥臭い手作業」で... ... 第3章:【超悲劇】「全...
はじめに|RAGは検索以前に、もう壊れている 多くのRAGは、検索やEmbeddingの改善以前に、「入力データの時点で精度の上限が決まっている」。 にもかかわらず私たちは、検索精度・Rerank・評価指標ばかりに目を向けてきた。 だが実際には、RAGに渡されるドキュメントはすでに構造を失ったテキストになっている。 これま...
おこしやす♪~ ☆彡今日の運が良くなるワンポイントハッピーレッスン 「因果応報」 (いんがおうほう) 『「言葉」には±の波動というエネルギーがあり、人に言った分、自分に戻ってくる。という宇宙の法則」があります。 即ち悪口やよくない言葉を使うといずれは自分に返ってくる。 やがて肉体的にも精神的にも体調不良にな...
「HYDE」に関連する商品は見つかりませんでした