https://github.com/lionerav2002/rag
A university project concerning the use of RAG(Retrieval Augmented Generation) technique and Spring framework to implement a simple financial advisor agent.
https://github.com/lionerav2002/rag
agentic-ai ai docker java llms ollama rag retrieval-augmented-generation spring
Last synced: 3 months ago
JSON representation
A university project concerning the use of RAG(Retrieval Augmented Generation) technique and Spring framework to implement a simple financial advisor agent.
- Host: GitHub
- URL: https://github.com/lionerav2002/rag
- Owner: lioneraV2002
- License: mit
- Created: 2025-01-31T11:41:37.000Z (over 1 year ago)
- Default Branch: master
- Last Pushed: 2025-02-06T22:56:56.000Z (over 1 year ago)
- Last Synced: 2025-04-02T10:18:08.902Z (about 1 year ago)
- Topics: agentic-ai, ai, docker, java, llms, ollama, rag, retrieval-augmented-generation, spring
- Language: Java
- Homepage:
- Size: 1.39 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# تولید مبتنی بر بازیابی (RAG)
تولید مبتنی بر بازیابی (RAG) یک چارچوب پیشرفته هوش مصنوعی است که مدلهای زبانی بزرگ (LLMs) را با ترکیب بازیابی اطلاعات و تولید متن بهبود میبخشد تا پاسخهایی دقیق، مبتنی بر زمینه و واقعی تولید کند. RAG محدودیتهای LLMs مانند توهم (تولید اطلاعات نادرست یا ساختگی) و دانش ثابت را با بازیابی پویا دادهها از منابع خارجی برطرف میکند. این روش در سال 2020 توسط Lewis و همکاران معرفی شد و از آن زمان به دلیل توانایی در بهبود دقت و انعطافپذیری در وظایف دانشمحور NLP، بهویژه در پرسوجوهای باز، مورد توجه قرار گرفته است [1].
## مکانیزمهای اصلی RAG
RAG از طریق یک خط لوله شامل **دریافت**، **جاسازی**، **ذخیرهسازی**، **بازیابی**، **تقویت** و **تولید** عمل میکند. در ادامه، هر مرحله بهطور مفصل با مثالها، بینشهای فنی و جزئیات پیادهسازی توضیح داده شده است.
### 1. **دریافت اسناد**
- **تعریف**: استخراج و پیشپردازش متن از اسناد منبع (مانند PDF، صفحات وب، پایگاههای داده).
- **فرآیند**:
- بارگذاری اسناد با ابزارهایی مانند `PagePdfDocumentReader` (برای PDF)، خزندههای وب یا Apache Tika.
- پاکسازی متن: حذف نویز مانند سرصفحهها، پاورقیها یا تصاویر.
- **تکهتکهسازی (Chunking)**: تقسیم متن به قطعات کوچکتر (100-500 توکن) برای جایگیری در پنجرههای زمینه LLM (مانند 4096 توکن برای GPT-3) و بهبود دقت بازیابی.
- **چرا تکهتکهسازی؟** قطعات کوچکتر دقت را افزایش میدهند و نویز را کاهش میدهند، اما باید زمینه را حفظ کنند.
- **روشهای تکهتکهسازی**:
- **ثابت (Fixed-size)**: تعیین تعداد توکنها (مثلاً 256) و همپوشانی (20 توکن) برای حفظ زمینه. مثال در LangChain:
```python
from langchain.text_splitter import CharacterTextSplitter
text_splitter = CharacterTextSplitter(separator="\n\n", chunk_size=256, chunk_overlap=20)
docs = text_splitter.create_documents([text])
```
- **آگاه از محتوا (Content-aware)**: تقسیم بر اساس ساختار (مانند جملات). ابزارها:
- **Naive**: تقسیم با نقطه یا خط جدید (`text.split(".")`).
- **NLTK**: تقسیم جملات با دقت بیشتر.
```python
from langchain.text_splitter import NLTKTextSplitter
text_splitter = NLTKTextSplitter()
docs = text_splitter.split_text(text)
```
- **spaCy**: تقسیم جملات با حفظ زمینه معنایی.
- **بازگشتی (Recursive)**: تقسیم با جداکنندههای مختلف تا رسیدن به اندازه مطلوب.
```python
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=20)
docs = text_splitter.create_documents([text])
```
- **تخصصی (Specialized)**: برای محتوای ساختاریافته (مانند Markdown، LaTeX) با حفظ ساختار.
```python
from langchain.text_splitter import MarkdownTextSplitter
markdown_splitter = MarkdownTextSplitter(chunk_size=100, chunk_overlap=0)
docs = markdown_splitter.create_documents([markdown_text])
```
- **مثال**: یک گزارش مالی 50 صفحهای به قطعات 200 توکنی تقسیم میشود، هر کدام یک پاراگراف یا خلاصه جدول.
- **چالشها**: مدیریت جداول، تصاویر یا متن چندزبانه نیازمند ابزارهای تخصصی است.
- **ابزارها**: Apache Tika، PDFBox، LangChain.
### 2. **تولید جاسازی**
- **تعریف**: تبدیل قطعات متن به بردارهای عددی متراکم که معنای معنایی را ضبط میکنند.
- **فرآیند**:
- استفاده از مدلهای جاسازی (مانند BERT، nomic-embed-text، text-embedding-ada-002 از OpenAI) برای نگاشت متن به بردارهای با ابعاد بالا (768 یا 1536).
- بردارها نقاطی در فضای معنایی هستند که معانی مشابه (مانند «سود» و «درآمد») نزدیک به هم هستند.
- **ریاضیات**: مدل جاسازی بردار $v \in \mathbb{R}^d$ تولید میکند، که $d$ تعداد ابعاد است.
- انواع جاسازی:
- **پراکنده (Sparse, e.g., TF-IDF)**: برای تطبیق کلمات کلیدی، کمهزینه اما معنای عمیق را ضبط نمیکند.
- **متراکم (Dense, e.g., BERT, SentenceBERT)**: معنای زمینهای را ضبط میکند، مناسب برای RAG اما محاسباتی سنگین.
- **مثال**: جمله «درآمد سهماهه اول 10٪ افزایش یافت» به یک بردار 768 بعدی تبدیل میشود که به «فروش در سهماهه اول رشد کرد» نزدیک است.
- **ابزارها**: Hugging Face Transformers، Sentence-BERT، OpenAI embeddings.
- **چالشها**: ذخیرهسازی بردارهای با ابعاد بالا؛ جاسازیهای خاص حوزه (مانند تنظیمشده برای مالی) دقت را بهبود میدهند.
### 3. **ذخیرهسازی بردار**
- **تعریف**: ذخیره جاسازیها در یک پایگاه داده برداری برای جستجوی مشابهت کارآمد.
- **فرآیند**:
- استفاده از پایگاههای داده مانند PostgreSQL با pgvector، Pinecone یا Weaviate.
- نمایهسازی با الگوریتمهای HNSW (جهان کوچک قابل پیمایش سلسلهمراتبی، O(log n)) یا IVFFlat (O(n/k)) برای جستجوی سریع همسایگی تقریبی (ANN).
- ذخیره متادیتا (مانند شناسه سند، شماره صفحه، متن قطعه) برای ردیابی.
- **مثال**: ذخیره 1000 قطعه از گزارش سالانه یک شرکت در pgvector با متادیتا که هر بردار را به صفحه منبع مرتبط میکند.
- **ریاضیات**: جستجوی ANN با معیارهایی مانند مشابهت کسینوسی: $cos(\theta) = \frac{v_1 \cdot v_2}{\|v_1\| \|v_2\|}$
- **چالشها**: تعادل بین اندازه نمایه و سرعت جستجو؛ بهروزرسانی جاسازیها برای اسناد جدید.
### 4. **بازیابی**
- **تعریف**: جستجوی پایگاه داده برداری برای یافتن قطعات مرتبط با پرسوجوی کاربر.
- **فرآیند**:
- جاسازی پرسوجو در یک بردار با همان مدل جاسازی.
- انجام جستجوی ANN برای بازیابی K قطعه برتر (K=3-10) بر اساس امتیازهای مشابهت.
- اختیاری: فیلتر بر اساس متادیتا (مانند تاریخ) یا بازمرتبسازی با رمزگذار متقاطع.
- **روشهای بازیابی**:
- **استاندارد/ساده**: استفاده از همان قطعات برای جاسازی و تولید.
- **پنجره جملات (Sentence-Window)**: تقسیم به قطعات کوچک (مانند جملات) برای جاسازی، افزودن زمینه اطراف برای تولید.
- **ادغام خودکار (Auto-merging)**: ترکیب قطعات کوچکتر به گروههای بزرگتر اگر مشابهت کافی باشد (مانند گروهبندی پاراگرافها).
- **مثال**: پرسوجوی «سود سهماهه اول چیست؟» جاسازی شده، قطعاتی درباره «درآمد» یا «سود» از گزارشهای سهماهه اول بازیابی میکند.
- **ابزارها**: FAISS، Milvus، pgvector.
- **چالشها**: قطعات نامرتبط (مانند دادههای سهماهه دوم برای پرسوجوی سهماهه اول). **راهحل**: جستجوی ترکیبی (کلمه کلیدی + بردار).
### 5. **تقویت پرسوجو**
- **تعریف**: غنیسازی پرسوجوی ورودی LLM با قطعات بازیابیشده برای هدایت تولید.
- **فرآیند**:
- ساخت پرسوجو: دستورالعملهای سیستمی + قطعات بازیابیشده + پرسوجوی کاربر.
- نمونه:
```
سیستم: شما یک مشاور مالی هستید. با استفاده از زمینه پاسخ دهید.
زمینه: [سود سهماهه اول 5 میلیون دلار بود، 10٪ افزایش (صفحه 3)؛ درآمد به 20 میلیون دلار رسید (صفحه 4)].
سؤال: سود سهماهه اول چیست؟
پاسخ:
```
- اختیاری: کوتاه کردن یا خلاصهسازی قطعات برای جایگیری در محدودیتهای زمینه.
- **مثال**: برای «ریسکهای سرمایهگذاری؟»، قطعاتی درباره نوسانات بازار گنجانده میشود.
- **چالشها**: اضافهبار با قطعات نامرتبط؛ **راهحل**: بازمرتبسازی یا آستانههای اهمیت.
### 6. **تولید**
- **تعریف**: استفاده از LLM برای تولید پاسخی منسجم و آگاه از زمینه.
- **فرآیند**:
- تغذیه پرسوجوی تقویتشده به LLM (مانند llama3.2:1b، GPT-4، BART).
- LLM دادهها را به پاسخ زبان طبیعی با ارجاعات ترکیب میکند.
- روشها:
- **RAG-Sequence**: استفاده از یک سند برای کل خروجی.
- **RAG-Token**: استفاده از اسناد مختلف برای هر توکن خروجی با جستجوی پرتو.
- **مثال**: خروجی: «سود سهماهه اول 5 میلیون دلار بود، 10٪ افزایش نسبت به سال گذشته [صفحه 3].»
- **ابزارها**: OpenAI API، Ollama، Hugging Face.
- **چالشها**: اطمینان از وفاداری (تطابق با زمینه) و انسجام.

*شکل 1: خط لوله RAG شامل دریافت، جاسازی، ذخیرهسازی، بازیابی و تولید [2].*
## مزایای RAG
- **دقت**: پاسخها را در دادههای واقعی پایهگذاری میکند، توهم را کاهش میدهد.
- **دانش پویا**: اسناد جدید را بدون بازآموزش در بر میگیرد.
- **مقیاسپذیری**: دادههای بزرگ را با پایگاههای داده برداری مدیریت میکند.
- **انطباقپذیری حوزه**: با دادههای تخصصی (مانند مالی، پزشکی) کار میکند.
- **شفافیت**: ارجاعات زمینهای امکان ردیابی منابع را فراهم میکند، برخلاف مدلهای بسته که «جعبه سیاه» هستند.
## چالشها و راهحلها
- **بازیابی نامرتبط**: جاسازیهای ضعیف یا دادههای پرنویز. **راهحل**: تنظیم دقیق جاسازیها، جستجوی ترکیبی (BM25 + بردار).
- **اضافهبار زمینه**: تعداد زیاد قطعات، محدودیتهای LLM را نقض میکند. **راهحل**: خلاصهسازی قطعات، پنجرههای لغزنده.
- **ارزیابی**: معیارهای وفاداری (تطابق با زمینه)، اهمیت (Precision@K)، انسجام (BLEU/ROUGE). **ابزارها**: RAGAS، ارزیابی انسانی.
- **تأخیر**: بازیابی + تولید کند است. **راهحل**: بهینهسازی نمایهسازی (HNSW)، کش پرسوجوها.
- **اندازه قطعات**: کوچکتر دقیقتر اما زمینه را از دست میدهد؛ بزرگتر نویز ایجاد میکند. **راهحل**: همپوشانی یا تنظیم اندازه.
## انواع RAG
1. **RAG ساده (Naive RAG)**:
- خط لوله پایه: بازیابی → تقویت → تولید.
- مثال: بازیابی 5 قطعه برتر، تغذیه به LLM (مانند پروژه شما).
- مزایا: ساده، مؤثر برای مجموعه دادههای کوچک.
- معایب: محدود به بازیابی تکمرحلهای، ممکن است زمینههای ظریف را از دست بدهد.
2. **RAG مدولار**:
- چندین بازیاب (بردار، کلمه کلیدی، گراف دانش).
- مثال: پرسوجوی «ریسکهای شرکت X» از پایگاه داده برداری (معناشناسی)، BM25 (عبارات دقیق) و گراف دانش (روابط مانند «X → رقیب Y») بازیابی میکند.
- مزایا: بهبود یادآوری با ترکیب نقاط قوت.
- معایب: پیچیدگی پیادهسازی.
3. **RAG تطبیقی (Adaptive RAG)**:
- انتخاب پویا استراتژی بازیابی بر اساس نوع پرسوجو.
- مثال: پرسوجوهای ساده («سود چیست؟») از LLM مستقیم، پرسوجوهای پیچیده («ریسکهای سهماهه اول؟») از بازیابی.
- مزایا: کارآمد برای بارهای کاری متنوع.
- معایب: نیاز به طبقهبند پرسوجو.
4. **RAG عاملی (Agentic RAG)**:
- ادغام ابزارها (مانند جستجوی وب، ماشینحساب) با بازیابی.
- مثال: پرسوجوی «مقایسه درآمد اپل در سهماهه اول و دوم» دادهها را بازیابی میکند، از ماشینحساب برای تفاوتها استفاده میکند، سپس تولید میکند.
- مزایا: مدیریت وظایف پیچیده.
- معایب: تأخیر بیشتر، ادغام ابزار.
5. **RAG تنظیمشده (Fine-Tuned RAG)**:
- تنظیم جاسازیها یا LLM برای حوزه خاص (مانند مالی).
- مثال: آموزش nomic-embed-text روی گزارشهای مالی برای جاسازیهای دقیقتر.
- مزایا: دقت بالا در حوزههای خاص.
- معایب: نیاز به دادههای برچسبدار و محاسبات.
6. **FLARE (Forward-Looking Active Retrieval)**:
- بازیابی پویا در حین تولید اگر اعتماد به خروجی کم باشد.
- مثال: در پاسخ به «روندهای بازار 2023»، اگر اعتماد به بخشی از پاسخ کم باشد، وب یا پایگاه دانش را جستجو میکند.
- مزایا: بهبود مستمر پاسخها.
- معایب: پیچیدگی و تأخیر.
7. **HyDE (Hypothetical Document Embeddings)**:
- تولید سند فرضی برای پرسوجو، جاسازی آن، و بازیابی اسناد مشابه.
- مثال: برای «ریسکهای تسلا»، سند فرضی درباره ریسکها تولید شده، سپس اسناد واقعی بازیابی میشوند.
- مزایا: بهبود بازیابی برای پرسوجوهای مبهم.
- معایب: محاسبات اضافی برای سند فرضی.

*شکل 2: انواع RAG، از ساده تا عاملی*
## سناریوهای مثال
1. **مشاور مالی**:
- ورودی: گزارش سهماهه اول تسلا. پرسوجو: «ریسکهای سهماهه اول تسلا چیست؟»
- RAG: قطعاتی درباره «مشکلات زنجیره تأمین، صفحه 5» بازیابی میکند، پرسوجو را تقویت میکند، تولید میکند: «تسلا در سهماهه اول با اختلالات زنجیره تأمین مواجه شد [صفحه 5].»
2. **دستیار پزشکی**:
- ورودی: PDFهای مجلات پزشکی. پرسوجو: «درمان فشار خون بالا؟»
- RAG: پروتکلهای دارویی را بازیابی میکند، تولید میکند: «لیزینوپریل توصیه میشود [مجله X، ص12].»
3. **تحقیق حقوقی**:
- ورودی: پایگاه داده قوانین قضایی. پرسوجو: «سوابق برای اختلافات قرارداد؟»
- RAG: موارد مرتبط را بازیابی میکند، خلاصهای با ارجاع تولید میکند.
4. **پشتیبانی مشتری**:
- ورودی: PDF سیاستهای شرکت. پرسوجو: «سیاست بازپرداخت چیست؟»
- RAG: بخشهای سیاست را بازیابی میکند، تولید میکند: «بازپرداخت در 30 روز [بخش 4.2].»
## بینشهای فنی
- **مدلهای جاسازی**: مدلهای کوچک (nomic-embed-text، ~100M پارامتر) سریع اما کمتر دقیق از مدلهای بزرگ (text-embedding-ada-002، ~500M پارامتر).
- **پایگاههای داده برداری**: pgvector منبعباز و مقرونبهصرفه است؛ Pinecone مقیاسپذیری مدیریتشده ارائه میدهد.
- **الگوریتمهای جستجو**: HNSW (O(log n)) سرعت را بهینه میکند؛ IVFFlat (O(n/k)) برای مجموعههای بزرگتر مناسب است.
- **مهندسی پرسوجو**: پرسوجوهای سیستمی (مانند «بهعنوان مشاور مالی عمل کنید») تمرکز حوزه را اعمال میکنند؛ مثالهای چندشاتی انسجام را بهبود میدهند.
- **آموزش RAG**: فقط رمزگذار پرسوجو و تولیدکننده متن آموزش میبینند (مانند DPR و BART)، نمایه اسناد ثابت میماند برای کاهش هزینه [1].
## معیارهای ارزیابی
- **وفاداری**: تطابق پاسخ با زمینه (امتیاز RAGAS یا دستی).
- **اهمیت**: قطعات مرتبط (Precision@K).
- **انسجام**: خوانایی خروجی (BLEU، ROUGE، ارزیابی انسانی).
- **تأخیر**: زمان کل (مانند 500 میلیثانیه برای بازیابی + 1 ثانیه برای تولید).
- **مقایسه عملکرد**: RAG در پرسوجوهای باز بهتر از روشهای استخراجی (انتخاب متن) یا بسته (بدون بازیابی) عمل میکند، پاسخهای متنوعتر و دقیقتر تولید میکند [1].
## بهبود سیستمهای RAG
1. **بازمرتبسازی (Re-ranking)**:
- استفاده از مدلهایی مانند MonoT5 یا MonoBERT برای اولویتبندی قطعات مرتبطتر پس از بازیابی اولیه.
- مثال: قطعات با امتیاز مشابهت پایینتر اما محتوای دقیقتر ارتقا مییابند.
2. **FLARE**: بازیابی پویا در حین تولید اگر اعتماد به بخشی از پاسخ کم باشد.
3. **HyDE**: تولید سند فرضی برای پرسوجو، جاسازی آن، و بازیابی اسناد مشابه برای پرسوجوهای مبهم.
4. **جستجوی ترکیبی**: ترکیب بردار و BM25 برای دقت و یادآوری بهتر.
5. **بهینهسازی زمینه**: خلاصهسازی قطعات یا استفاده از مدلهای فشردهسازی برای جایگیری در محدودیتهای LLM.
## ارجاعات
1. Lewis, P., et al. (2020). "تولید مبتنی بر بازیابی برای وظایف NLP دانشمحور." *NeurIPS*. [arXiv:2005.11401](https://arxiv.org/abs/2005.11401).
2. Saurabh, S. (2024). "خط لوله RAG: چگونه پردازش زبان طبیعی را متحول میکند." *Medium*. [Link](https://medium.com/@ashleygreen9910/rag-pipeline-how-it-transforms-natural-language-processing-6ee7c076cc25).
3. Gao, Y., et al. (2023). "تولید مبتنی بر بازیابی برای مدلهای زبانی بزرگ: یک بررسی." [arXiv:2312.10997](https://arxiv.org/abs/2312.10997).
4. LangChain. "مستندات LangChain: تقسیمکنندههای متن." [Link]().
- Hugging Face. "مستندات Transformers: جاسازیهای متنی." [huggingface/tasks/sentence-similarity](https://huggingface.co/tasks/sentence-similarity).
- [langchain.com/docs/integrations/document_transformers](https://python.langchain.com/docs/integrations/document_transformers/)
6. pgvector. "pgvector: جستجوی مشابهت برداری منبعباز برای Postgres." [https://github.com/pgvector/pgvector](https://github.com/pgvector/pgvector).
7. https://www.google.com/url?sa=i&url=https%3A%2F%2Fwww.linkedin.com%2Fposts%2Ftheravitshow_data-rag-vectordatabases-activity-7237744549823995904-OEJ7&psig=AOvVaw3WjOk8tf-zp8HBQAGD07yz&ust=1757767439302000&source=images&cd=vfe&opi=89978449&ved=0CBUQjhxqFwoTCMiNlJqg048DFQAAAAAdAAAAABAL
## پروژه من: FIN.AI و پیادهسازی RAG
**توضیح ساده**: FIN.AI یک برنامه Spring Boot است که به کاربران امکان میدهد PDFهای مالی را بارگذاری کنند، آنها را بهصورت بردار در PostgreSQL (pgvector) ذخیره کنند و از طریق رابط چت WebSocket در زمان واقعی پرسوجو کنند. از RAG برای پاسخ به سؤالاتی مانند «درآمد سهماهه اول چیست؟» با پاسخهای مبتنی بر اسناد بارگذاریشده استفاده میکند، با پشتیبانی از Ollama (محلی) یا OpenAI (ابری).
**چگونه RAG را بهطور کامل پیادهسازی میکند**:
- **دریافت**: `FinancialRagService.uploadPDF` از `PagePdfDocumentReader` برای استخراج متن PDF و `TokenTextSplitter` برای تکهتکهسازی (مانند قطعات 200 توکنی) استفاده میکند، با پشتیبانی از روشهای ثابت و آگاه از محتوا.
- **جاسازی/ذخیرهسازی**: قطعات با nomic-embed-text (Ollama) یا text-embedding-ada-002 (OpenAI) جاسازی شده و در pgvector با نمایهسازی HNSW ذخیره میشوند، امکان جستجوی سریع ANN را فراهم میکند.
- **بازیابی/تقویت**: `QuestionAnswerAdvisor` در `ChatClientConfigurations` از `VectorStore` برای بازیابی K قطعه برتر (SearchRequest) استفاده میکند، پرسوجوها را با دستورالعملهای سیستمی (مانند «بهعنوان مشاور مالی عمل کنید») تقویت میکند.
- **تولید**: `FinancialRagService.query` از `ChatClient` برای فراخوانی llama3.2:1b یا GPT-4o استفاده میکند، پاسخهای ارجاعدار تولید میکند (مانند «درآمد 10 میلیون دلار بود [گزارش سهماهه اول، ص4]»).
- **تمرکز حوزه**: پرسوجوهای سیستمی در `ChatClientConfigurations` (مانند «پاسخهای صرفاً مالی ارائه دهید») و اعتبارسنجی در `query` پرسوجوهای غیرمالی را فیلتر میکنند.
- **زمان واقعی**: WebSocket (`WebSocketConfiguration`) پرسوجوی فوری را با ارسال پیام به `/socket-chat` تضمین میکند، ایدهآل برای تحلیل مالی تعاملی.
- **انواع RAG**: پروژه از RAG ساده استفاده میکند اما با افزودن بازمرتبسازی (مانند MonoBERT) یا FLARE قابل ارتقا به RAG مدولار یا عاملی است.
**چرا کامل است؟**:
- **خط لوله کامل**: از دریافت (PDF) تا تولید (پاسخهای ارجاعدار) را پوشش میدهد.
- **انعطافپذیر**: با پروفایلهای `ollama` و `openai` بین محلی و ابری جابهجا میشود.
- **مقیاسپذیر**: pgvector مجموعه دادههای بزرگ را مدیریت میکند؛ WebSocket برای کاربران مقیاس میشود.
- **آموزشی**: ساختار کد واضح (سرویسها، کنترلکنندهها، پیکربندیها) RAG را در عمل نشان میدهد، با پشتیبانی از جاسازیهای متراکم و جستجوی ترکیبی بالقوه.
- **متمرکز بر حوزه**: با پرسوجوهای سیستمی و اعتبارسنجی، پاسخها را به امور مالی محدود میکند، با قابلیت گسترش به حوزههای دیگر (مانند پزشکی).
FIN.AI یک سیستم RAG عملی و آماده تولید است که برای پرسوجوی مالی طراحی شده و مفاهیم اصلی و قابلیت گسترش را نشان میدهد، با ادغام فناوریهای مدرن مانند Spring AI، WebSocket و pgvector.