实时数据规模与质量指标
从数据采集到API服务的完整链路
六大能力模块,覆盖数据治理全链路
自动采集沪深交易所公告列表,支持按股票、日期、分类筛选。每日定时运行,去重入库。
自动下载公告PDF文件,双引擎提取文本(Tika + pdfplumber),支持OSS云端存储。
正则引擎从年报文本中提取:营业收入、净利润、扣非净利润、总资产、净资产、EPS、ROE、毛利率、净利率、资产负债率。100%准确率。
非空检查 → 格式校验 → 合理性校验。每条记录标注 passed / warning / failed 质量标签。
FastAPI构建高性能API服务,支持API Key鉴权、100次/分钟限流、自动Swagger文档。
Cron定时任务:批量提取(每日02:00)+ 实时提取(每20分钟),结果自动推送微信。
所有接口均需 X-API-Key 鉴权,限流 100次/分钟
| 方法 | 路径 | 说明 |
|---|---|---|
| GET | /api/v1/announcements | 查询公告列表(支持股票代码/分类/日期/关键词筛选+分页) |
| GET | /api/v1/announcements/{id} | 查询公告详情(可选包含全文内容) |
| GET | /api/v1/financial-indicators | 查询财务指标列表(支持股票/报告期/质量状态筛选) |
| GET | /api/v1/financial-indicators/{sec_code} | 查询单只股票全部财务指标 |
| GET | /api/v1/stats | 系统统计数据概览 |
| GET | /api/v1/keys | 列出所有API Key(管理接口) |
| POST | /api/v1/keys | 创建新API Key(管理接口) |
| GET | /health | 健康检查(公开,无需鉴权) |
3步接入数据服务
100次压力测试结果(本地环境)
✅ 全部接口平均响应 < 10ms,远低于 200ms 目标
正则引擎提取 · 60份测试集 · 100%准确率
含同比增长率
含同比增长率
含同比增长率
资产负债表
股东权益
基本EPS
加权平均净资产收益率
销售毛利率
净利润率
负债比率
⚠️ 免责声明:本平台提供的数据仅供参考,不构成任何投资建议。虽然我们尽最大努力确保数据准确性,但不对其完整性、及时性或准确性作任何明示或暗示的保证。用户应自行验证数据并承担使用风险。
📢 数据来源:本平台数据来源于公开披露的上市公司公告。相关公告的版权归原作者所有。
🔒 隐私政策:本平台仅收集必要的API使用信息(Key名称、请求日志),不会向第三方共享用户数据。
📦 开源依赖:本产品基于以下开源项目构建:FastAPI (MIT)、Apache Tika (Apache 2.0)、pdfplumber (MIT)、Uvicorn (BSD-3)。