网上药店
您现在的位置: 股票作手回忆录 >> 股票作手回忆录内容 >> 正文 >> 正文

python量化批量从pdf中提取基

来源:股票作手回忆录 时间:2021/5/30
接上篇,我们已经爬下来了所有的基金年报。这篇我们来说明怎么通过python批量获取全部基金经理的观点,用到的数据就是所有的基金年报,还没爬或者还不知道怎么爬的可以看看上一篇。我这里只把所有的混合型和股票型基金的年报爬下来了,不嫌慢的话,也可以考虑把其他债券、货币、ETF等等类型的都搞下来。

#保留股票型和混合型allpdf[ifstock]=allpdf.announcementTitle.map(lambdax:股票型inxor混合型inx)allpdf1=allpdf.loc[allpdf.ifstock].reset_index(drop=True)getFundReportpdf(allpdf1,fpath)爬下来大概需要一小时吧,份,还是挺快的。先说下我们要干啥,免得有的童鞋云里雾里。基金年报里有一大章是管理人报告,我们主要针对里面的两小节:管理人对报告期内基金的投资策略和业绩表现的说明、管理人对宏观经济、证券市场及走势的简要展望。这两节里,前一节基金经理会对过去这一整年的投资逻辑和业绩情况给一个说明,分析赚钱或者赔钱的原因。后一节里投资者会对未来的市场做一个展望。有的基金经理很懒,每年都是复制粘贴上一年的话不变,有的很勤奋,洋洋洒洒写个一两页。总之

转载请注明:http://www.feijiquandao.com/hylnr/7702.html