Files
ncuetalk_backend/README.md
dsyoon 46460b77f8 init
2025-12-27 14:06:26 +09:00

505 lines
13 KiB
Markdown

# 엔큐톡 (ncuetalk) - 다목적 AI 채팅 플랫폼
엔큐톡은 다양한 AI 도구들을 통합한 웹 기반 채팅 플랫폼입니다. ChatGPT, 문서 분석, 번역, 연구 질의응답 등 여러 AI 서비스를 하나의 통합 인터페이스에서 제공합니다.
## 📋 목차
- [주요 기능](#주요-기능)
- [프로젝트 구조](#프로젝트-구조)
- [설치 및 실행](#설치-및-실행)
- [도구별 상세 가이드](#도구별-상세-가이드)
- [API 문서](#api-문서)
- [개발 가이드](#개발-가이드)
## 🚀 주요 기능
### 🔧 통합 AI 도구 플랫폼
- **6개의 전문 AI 도구** 통합 제공
- **통일된 채팅 인터페이스**로 일관된 사용자 경험
- **세션 관리** 및 **대화 기록** 저장
- **파일 업로드 및 처리** 기능
### 🎯 지원 도구 목록
| 도구 | 기능 | 특징 |
|------|------|--------------------------|
| **ChatGPT** | OpenAI 모델 대화 | GPT-5 등 다중 모델 지원 |
| **GxP 챗봇** | GxP 문서 질의응답 | 벡터 DB 기반 문서 검색 |
| **개발챗봇** | PDF 문서 분석 | PDF 업로드, 벡터 검색, 지식베이스 모드 |
| **문서번역** | 한영 번역 서비스 | Word 문서 + 실시간 텍스트 번역 |
| **연구QA** | 연구 질의응답 | 외부 연구 플랫폼 연동 |
| **Text2SQL** | LIMS 데이터 조회 | 자연어를 SQL로 변환 |
## 📁 프로젝트 구조
```
ncuetalk/
├── README.md # 프로젝트 문서
├── requirements.txt # Python 의존성
├── index.html # 메인 웹 페이지
├── main.js # 프론트엔드 로직
├── style.css # 스타일시트
├──
├── backend/ # 백엔드 서버
│ ├── app.py # FastAPI 메인 앱
│ └── engines/ # AI 도구 엔진들
│ ├── __init__.py # 엔진 레지스트리
│ ├── chatgpt_tool/ # ChatGPT 도구
│ ├── chatbot_gxp/ # GxP 챗봇
│ ├── dev_chatbot/ # 개발챗봇
│ ├── doc_translation/ # 문서번역
│ ├── research_qa/ # 연구QA
│ └── lims_text2sql/ # Text2SQL
├── frontend/ # 프론트엔드 리소스
│ ├── dev_chatbot/ # 개발챗봇 UI 컴포넌트
│ ├── lims_text2sql/ # Text2SQL UI
│ └── research_qa/ # 연구QA UI
├── uploads/ # 업로드된 파일들
├── chroma_db/ # 벡터 데이터베이스
├── logs/ # 시스템 로그
└── scripts/ # 유틸리티 스크립트
```
## 🛠 설치 및 실행
### 전제 조건
- Python 3.8+
- Node.js (선택사항, 프론트엔드 개발 시)
- OpenAI API 키
### 1. 환경 설정
```bash
# 저장소 클론
git clone <repository-url>
cd ncuetalk
# 가상환경 생성 및 활성화
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 의존성 설치
pip install -r requirements.txt
```
### 2. 환경 변수 설정
프로젝트 루트에 `.env` 파일 생성:
```env
# OpenAI API 설정
OPENAI_API_KEY=your_openai_api_key_here
# Ollama 모델 설정 (자체모델 사용 시)
OLLAMA_MODEL=gpt-oss:latest
LLM_PROVIDER=ollama
# 기타 설정
UPLOAD_MAX_SIZE=50MB
```
### 3. 서버 실행
```bash
# 백엔드 서버 시작
cd backend
python -m uvicorn app:app --host 0.0.0.0 --port 8010 --reload
# 프론트엔드 서버 시작 (별도 터미널)
cd ..
python -m http.server 3000
```
### 4. 웹 브라우저에서 접속
- 프론트엔드: http://localhost:3000
- 백엔드 API: http://localhost:8010
- API 문서: http://localhost:8010/docs
## 🎯 도구별 상세 가이드
### 1. ChatGPT 💬
**기능**: OpenAI의 ChatGPT 모델과 직접 대화
**지원 모델**:
- `auto`: 자동 선택 (기본값)
- `gpt-5`: GPT-5 모델
**사용법**:
1. 도구 목록에서 "ChatGPT" 선택
2. 모델 선택 드롭다운에서 원하는 모델 선택
3. 채팅창에 질문 입력 후 엔터
### 2. GxP 챗봇 📋
**기능**: GxP(Good Practice) 문서에 대한 전문적인 질의응답
**특징**:
- Adobe PDF Services API 기반 고품질 텍스트 추출
- ChromaDB 벡터 데이터베이스를 활용한 의미 검색
- AI Agent 기반 도구 선택 자동화
**사용법**:
1. "GxP 챗봇" 선택
2. GxP 관련 질문 입력 (예: "mapping test가 무엇인지?")
3. 벡터 검색을 통해 관련 문서에서 답변 생성
### 3. 개발챗봇 🛠
**기능**: PDF 문서 업로드 및 분석을 통한 질의응답
**주요 기능**:
- PDF 파일 업로드 및 벡터화
- 문서 기반 질의응답
- 출처 페이지 번호 제공
- 지식베이스 전용 모드 지원
**사용법**:
1. "개발챗봇" 선택
2. 좌측 파일 리스트에서 "+" 버튼으로 PDF 업로드
3. 모델 선택: "자체모델" (Ollama 기반)
4. 지식모드 선택: "지식베이스" (업로드된 문서만 참조)
5. 업로드한 문서에 대해 질문
**파일 관리**:
- 지원 형식: PDF 파일만
- 최대 파일 크기: 환경 설정에 따름
- 파일 삭제: 각 파일 옆 "✕" 버튼
### 4. 문서번역 🌐
**기능**: 한국어를 영어로 번역 (Word 문서 + 실시간 텍스트)
**지원 기능**:
- **Word 문서 번역**: .doc/.docx 파일 업로드 후 일괄 번역
- **실시간 텍스트 번역**: 채팅창에 입력한 텍스트 즉시 번역
- **이중언어 문서 생성**: 원본과 번역문이 함께 포함된 결과 파일
**모델 선택**:
- **자체모델**: Ollama 기반 gpt-oss:latest (빠른 처리)
- **외부모델**: OpenAI GPT-5 (고품질 번역)
**사용법**:
**📄 Word 문서 번역**:
1. "문서번역" 선택
2. 좌측 파일 리스트에서 "+" 버튼
3. .doc 또는 .docx 파일 선택
4. 자동으로 번역 처리 시작
5. 완료 후 "[원본다운]", "[결과다운]" 버튼으로 파일 다운로드
**💬 실시간 텍스트 번역**:
1. "문서번역" 선택
2. 모델 선택 (자체모델/외부모델)
3. 채팅창에 번역할 한국어 텍스트 입력
4. 즉시 영어 번역 결과 확인
**예시**:
```
입력: "안녕하세요. 오늘 날씨가 좋네요."
출력: "Hello. The weather is nice today."
```
### 5. 연구QA 📚
**기능**: 연구 관련 질의응답 (외부 플랫폼 연동)
**특징**:
- 외부 연구 플랫폼과 iframe 연동
- 연구 방법론, 데이터 분석, 논문 작성 지원
**사용법**:
1. "연구QA 챗봇" 선택
2. 자동으로 외부 연구 플랫폼 로드
3. 연동된 플랫폼에서 직접 질의응답
### 6. Text2SQL (LIMS) 🗃
**기능**: 자연어를 SQL 쿼리로 변환하여 LIMS 데이터 조회
**특징**:
- 자연어 질의를 SQL로 자동 변환
- LIMS 데이터베이스 전용 최적화
**사용법**:
1. "Text2SQL (LIMS)" 선택
2. 자동으로 외부 LIMS 플랫폼 로드
3. 자연어로 데이터 조회 요청
## 📚 API 문서
### 🔗 공통 엔드포인트
#### GET `/`
- **설명**: 서버 상태 확인
- **응답**: `{"message": "엔큐톡 AI 채팅 서버가 실행 중입니다."}`
#### GET `/tools`
- **설명**: 사용 가능한 도구 목록 조회
- **응답**:
```json
[
{
"id": "chatgpt",
"name": "ChatGPT",
"description": "OpenAI ChatGPT 모델과 대화할 수 있는 도구입니다."
}
]
```
#### POST `/chat`
- **설명**: 통합 채팅 엔드포인트 (모든 도구 지원)
- **Content-Type**: `multipart/form-data`
- **Parameters**:
- `message` (string, required): 사용자 메시지
- `tool_id` (string, required): 도구 ID
- `session_id` (string, optional): 세션 ID
- `model` (string, optional): 모델명 (기본값: "exone3.5")
- `knowledge_mode` (string, optional): 지식 모드 ("hybrid", "kb_only")
- `image` (file[], optional): 이미지 파일들
- **응답**:
```json
{
"response": "AI 응답 텍스트",
"status": "success",
"session_id": "생성된_세션_ID",
"tool_name": "도구명"
}
```
### 🛠 개발챗봇 API
**Base Path**: `/`
#### POST `/upload_pdf`
- **설명**: PDF 파일 업로드 및 벡터화
- **Content-Type**: `multipart/form-data`
- **Parameters**:
- `files` (file[], required): PDF 파일들
- **응답**:
```json
{
"status": "success",
"files": ["파일명1.pdf", "파일명2.pdf"]
}
```
#### GET `/files`
- **설명**: 업로드된 PDF 파일 목록 조회
- **응답**:
```json
{
"files": ["파일명1.pdf", "파일명2.pdf"]
}
```
#### GET `/file_content`
- **설명**: PDF 파일 내용 조회
- **Parameters**:
- `filename` (string, required): 파일명
- **응답**: PDF 내용을 JSON 형태로 반환
#### DELETE `/delete_pdf/{filename}`
- **설명**: PDF 파일 삭제
- **Parameters**:
- `filename` (string, required): 삭제할 파일명
#### GET `/pdf`
- **설명**: PDF 파일 뷰어 제공
- **Parameters**:
- `filename` (string, required): 파일명
### 🌐 문서번역 API
**Base Path**: `/doc_translation`
#### POST `/upload_doc`
- **설명**: Word 문서 업로드 및 번역
- **Content-Type**: `multipart/form-data`
- **Parameters**:
- `files` (file[], required): Word 파일들 (.doc, .docx)
- **응답**:
```json
{
"status": "success",
"files": [
{
"original_filename": "원본파일명.docx",
"result_filename": "결과파일명.docx",
"status": "success"
}
]
}
```
#### GET `/files`
- **설명**: 번역 파일 목록 조회
- **응답**:
```json
[
{
"filename": "원본파일명.docx",
"result_filename": "결과파일명.docx",
"has_result": true
}
]
```
#### GET `/download/{filename}`
- **설명**: 파일 다운로드
- **Parameters**:
- `filename` (string, required): 다운로드할 파일명
#### DELETE `/delete/{original_filename}`
- **설명**: 번역 파일 삭제 (원본+결과 모두)
- **Parameters**:
- `original_filename` (string, required): 원본 파일명
### 📋 GxP 챗봇 API
**Base Path**: `/gxp`
#### POST `/chat`
- **설명**: GxP 챗봇 대화
- **Parameters**:
- `query` (string, required): 질의 내용
- `session_id` (string, required): 세션 ID
#### POST `/ai-agent-chat`
- **설명**: AI Agent 기반 GxP 챗봇 대화
- **Parameters**:
- `query` (string, required): 질의 내용
- `session_id` (string, required): 세션 ID
#### GET `/active-sessions`
- **설명**: 활성 세션 목록 조회
#### GET `/serve-gxp-pdf/{filename}`
- **설명**: GxP PDF 파일 제공
#### GET `/search-vector-db`
- **설명**: 벡터 DB 검색
- **Parameters**:
- `query` (string, required): 검색 쿼리
- `plant` (string, optional): 공장명 필터
- `filename` (string, optional): 파일명 필터
- `collection_name` (string, optional): 컬렉션명 필터
#### GET `/collections`
- **설명**: ChromaDB 컬렉션 목록 조회
#### GET `/collections/{collection_name}`
- **설명**: 특정 컬렉션 정보 조회
### 💬 ChatGPT API
**Base Path**: `/chatgpt`
#### POST `/chat`
- **설명**: ChatGPT 전용 대화 엔드포인트
- **Parameters**:
- `message` (string, required): 메시지
- `model` (string, optional): 모델명 ("auto", "gpt-5", etc.)
- `session_id` (string, optional): 세션 ID
## 🔧 개발 가이드
### 새로운 도구 추가하기
1. **엔진 디렉토리 생성**:
```bash
mkdir backend/engines/new_tool
```
2. **`__init__.py` 작성**:
```python
TOOL_ID = "new_tool"
TOOL_INFO = {
"name": "새 도구",
"description": "새 도구 설명",
"system_prompt": "시스템 프롬프트"
}
# 필요한 함수들 구현
def prepare_context(question: str, **kwargs) -> str:
# 컨텍스트 준비 로직
return "준비된 컨텍스트"
# FastAPI router (선택사항)
from fastapi import APIRouter
router = APIRouter()
@router.get("/new-endpoint")
async def new_endpoint():
return {"message": "새 엔드포인트"}
```
3. **백엔드 등록**:
```python
# backend/app.py에 추가
from engines.new_tool import router as new_tool_router
app.include_router(new_tool_router, prefix="/new_tool")
```
4. **프론트엔드 통합**:
```javascript
// main.js에 도구별 로직 추가
} else if (toolId === 'new_tool') {
// 새 도구 전용 UI 로직
}
```
### 환경 변수 설정
`.env` 파일에서 다음 변수들을 설정할 수 있습니다:
```env
# 필수 설정
OPENAI_API_KEY=your_api_key
# 선택적 설정
OLLAMA_MODEL=gpt-oss:latest
LLM_PROVIDER=ollama
UPLOAD_MAX_SIZE=50MB
VECTOR_DB_PATH=./chroma_db
LOG_LEVEL=INFO
```
### 로깅
시스템 로그는 `logs/chat.log`에 저장됩니다:
- 채팅 요청/응답 로그
- 오류 로그
- 파일 업로드/삭제 로그
### 데이터베이스
- **벡터 DB**: ChromaDB (`chroma_db/` 디렉토리)
- **파일 저장**: `uploads/` 디렉토리
- **세션 데이터**: 메모리 저장 (서버 재시작 시 초기화)
## 🤝 기여하기
1. Fork 저장소
2. Feature 브랜치 생성 (`git checkout -b feature/AmazingFeature`)
3. 변경사항 커밋 (`git commit -m 'Add some AmazingFeature'`)
4. 브랜치에 Push (`git push origin feature/AmazingFeature`)
5. Pull Request 생성
## 📄 라이선스
이 프로젝트는 MIT 라이선스 하에 배포됩니다.
## 📞 지원
문제가 발생하거나 질문이 있으시면:
- GitHub Issues 생성
- 개발팀 연락
---
**엔큐톡**과 함께 더 스마트한 AI 경험을 만들어보세요! 🚀