🚀 v1.0.0 · 内测中

📊 FinData — AI数据治理产品

金融公告采集 → 财务指标提取 → 结构化数据服务

沪深交易所公告全量采集 · 10项核心指标100%准确率 · RESTful API即接即用

📈 数据概览

实时数据规模与质量指标

1,500
公告总量
沪深交易所
66
覆盖股票
持续扩展中
10
财务指标
核心+扩展
100%
提取准确率
60份测试集验证

🏗️ 系统架构

从数据采集到API服务的完整链路

📡
公告采集
SSE/SZSE API
📄
PDF下载
本地+OSS存储
🔍
文本提取
Tika + pdfplumber
🧠
指标提取
正则引擎 v1
质量校验
三级校验体系
🔌
API服务
FastAPI + SQLite

💎 核心功能

六大能力模块,覆盖数据治理全链路

📥

公告全量采集

自动采集沪深交易所公告列表,支持按股票、日期、分类筛选。每日定时运行,去重入库。

📑

PDF下载与文本提取

自动下载公告PDF文件,双引擎提取文本(Tika + pdfplumber),支持OSS云端存储。

🎯

10项财务指标提取

正则引擎从年报文本中提取:营业收入、净利润、扣非净利润、总资产、净资产、EPS、ROE、毛利率、净利率、资产负债率。100%准确率

🛡️

三级质量校验

非空检查 → 格式校验 → 合理性校验。每条记录标注 passed / warning / failed 质量标签。

RESTful API

FastAPI构建高性能API服务,支持API Key鉴权、100次/分钟限流、自动Swagger文档。

定时自动化

Cron定时任务:批量提取(每日02:00)+ 实时提取(每20分钟),结果自动推送微信。

🔌 API 接口

所有接口均需 X-API-Key 鉴权,限流 100次/分钟

方法路径说明
GET /api/v1/announcements 查询公告列表(支持股票代码/分类/日期/关键词筛选+分页)
GET /api/v1/announcements/{id} 查询公告详情(可选包含全文内容)
GET /api/v1/financial-indicators 查询财务指标列表(支持股票/报告期/质量状态筛选)
GET /api/v1/financial-indicators/{sec_code} 查询单只股票全部财务指标
GET /api/v1/stats 系统统计数据概览
GET /api/v1/keys 列出所有API Key(管理接口)
POST /api/v1/keys 创建新API Key(管理接口)
GET /health 健康检查(公开,无需鉴权)

⚡ 快速开始

3步接入数据服务

# 1. 获取API Key(联系管理员开通账号) # 2. 查询公告列表 curl -H "X-API-Key: YOUR_API_KEY" \\ "https://api.your-domain.com/api/v1/announcements?sec_code=688001&page=1" # 3. 查询财务指标 curl -H "X-API-Key: YOUR_API_KEY" \\ "https://api.your-domain.com/api/v1/financial-indicators/688001"
# Python SDK 示例 import requests API_BASE = "https://api.your-domain.com" HEADERS = {"X-API-Key": "YOUR_API_KEY"} # 查询华兴源创财务指标 resp = requests.get(f"{API_BASE}/api/v1/financial-indicators/688001", headers=HEADERS) data = resp.json()["data"] print(f"公司: {data['sec_name']}") for record in data["records"]: print(f" 报告期: {record['report_period']}") print(f" 营业收入: {record['revenue_value']} {record['revenue_unit']}") print(f" 净利润: {record['net_profit_value']} {record['net_profit_unit']}")

📊 性能指标

100次压力测试结果(本地环境)

7.6ms
平均响应时间
6.7ms
P50 中位数
8.6ms
P95
100%
成功率

✅ 全部接口平均响应 < 10ms,远低于 200ms 目标

🛠️ 技术栈

🐍 Python 3.13 ⚡ FastAPI 🗄️ SQLite + WAL 📄 Apache Tika 📐 pdfplumber 🔧 Uvicorn 🛡️ SlowAPI 限流 📡 SSE/SZSE API ☁️ 阿里云 OSS

🎯 10项财务指标

正则引擎提取 · 60份测试集 · 100%准确率

💰 营业收入

含同比增长率

📈 净利润

含同比增长率

🔍 扣非净利润

含同比增长率

🏦 总资产

资产负债表

💎 净资产

股东权益

📄 每股收益

基本EPS

📊 ROE

加权平均净资产收益率

🏷️ 毛利率

销售毛利率

📉 净利率

净利润率

⚖️ 资产负债率

负债比率

🚀 开始使用

获取API Key,即刻接入金融公告与财务指标数据服务

📖 Swagger UI 📚 完整API文档 🔖 ReDoc