一个功能强大的智能体系统,能够自动搜索、下载和分析学术论文和数据集,并生成结构化的研究报告。
该系统集成了 ArXiv 和 Google Scholar 搜索,使用 DeepSeek API 进行智能摘要生成,为研究人员提供高效的学术资料处理解决方案。
技术栈
Python 3.8+
Flask
DeepSeek API
ArXiv API
Google Scholar
Kaggle API
HuggingFace Hub
PyPDF2
BeautifulSoup4
ThreadPoolExecutor
RESTful API
核心功能
- 论文质量评分算法:基于新颖性、影响力、权威性的多维度评分系统
- AI 智能分析:使用 DeepSeek API 生成中文摘要、关键贡献点提取、PDF 文本分析
- 结构化报告生成:自动生成 Markdown 格式报告,包含执行摘要、详细分析、总结建议
技术亮点
- 多 Agent 协作架构:SearchAgent、DownloadAgent、AnalysisAgent、ReportAgent 分工协作,Coordinator 统一协调
- 并发处理优化:并行搜索、并行下载、并行分析,使用 ThreadPoolExecutor 线程池管理,可配置并发数
- 论文质量评分算法:质量分 = 0.5×新颖性分 + 0.4×引用分 + 0.1×权威性加分,多维度评估论文质量
- 多源去重机制:基于标题的智能去重,合并多源搜索结果,保留最优数据源信息
- 智能时间范围解析:从关键词自动提取时间范围(如"最近7天"),支持中英文别名识别
- 端到端自动化:从搜索到报告生成全流程自动化,提升研究效率