feat: 1분봉 수집 지원 및 10년 기본 수집 기간 확장

1분봉 건너뛰기를 제거하고 예상 API 요청·진행률 로그를 추가한다.

Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
dsyoon
2026-06-11 13:33:05 +09:00
parent c164dfbc84
commit 6e72fe44a7
6 changed files with 97 additions and 22 deletions

View File

@@ -6,7 +6,7 @@
- 빗썸 Public API(v1) 기반 분·일·주·월봉 캔들 수집
- SQLite(`coins.db`) 저장 — 테이블명 `{SYMBOL}_{인터벌코드}` (예: `BTC_60`, `BTC_10080`)
- 2017-01-01~ 역방향 페이지네이션 수집 (기본 3447일)
- 2017-01-01~ 역방향 페이지네이션 수집 (기본 3650일·10년, **1분봉 포함**)
- Ground Truth 기반 선물 롱·숏 벤치마크 및 인과 전략 시뮬레이션
## 요구사항
@@ -30,8 +30,8 @@ cp .env.example .env # API 키 등 입력
| `SYMBOL` | 코인 심볼 | `BTC` |
| `COIN_NAME` | 코인 이름 | `비트코인` |
| `DB_PATH` | SQLite 경로 | `coins.db` |
| `DOWNLOAD_DAYS` | 수집·차트 일수 (2017~) | `3447` |
| `DOWNLOAD_INTERVALS` | 인터벌 코드 목록 | `3,5,10,15,30,60,240,1440,10080,43200` |
| `DOWNLOAD_DAYS` | 수집·차트 일수 (10년) | `3650` |
| `DOWNLOAD_INTERVALS` | 인터벌 코드 목록 (`1`=1분봉) | `1,3,5,10,15,30,60,240,1440,10080,43200` |
| `BITHUMB_API_CANDLE_COUNT` | 요청당 캔들 수 (최대 200) | `200` |
| `API_REQUEST_SLEEP_SEC` | API 호출 간격(초) | `0.35` |
@@ -57,9 +57,12 @@ cp .env.example .env # API 키 등 입력
0단계(GT 타점)를 먼저 만든 뒤, 1단계 sim을 돌립니다.
```bash
# 사전: 데이터 수집
# 사전: 데이터 수집 (전체 인터벌)
python scripts/01_download.py
# 1분봉 10년만 수집 (수 시간 소요)
python scripts/download_candles.py --days 3650 --intervals 1
# 0단계: Ground Truth 타점 생성 (v1/v2/v3)
python scripts/02_ground_truth.py