README

《在会计研究中使用Python进行文本分析》中文翻译

0 简介

《Using Python For Text Analysis In Accounting Research》是一本介绍在会计研究中使用Python进行文本分析的专著。在学校过程中,我发现python文本分析相关中文资料有很多,但是python文本分析在会计研究中的应用的相关中文资料少之又少。我在阅读本书后,发现本书很好地构建了一个框架,非常适合入门学习。遂对本书进行翻译,不当之处,敬请谅解。

1 本书特点

  1. 介绍的文本分析的方法以及参考文献大多使用直观的基于公式的计算方法,而非基于复杂的机器学习方法。我想,这可能是在经管领域更加注意可解释性的原因。如果使用机器学习方法进行文本分析,并希望有可解释性,可以参考:https://shap.readthedocs.io/en/latest/text_examples.html
  2. 翻译了本书最核心的7-10章部分。因为其他部分介绍的比较粗略,有更合适更专门的教程学习。在这里简单推荐一些我认为比较不错的:Pandas:https://pandas.liuzaoqi.com/intro.html 正则:https://regexlearn.com/zh-cn/learn
  3. 本书分析的文本内容为英文文本。

2 资料

  1. 在线阅读:https://weak.notion.site/README-2a5260b7433241dfb4eaa6e6f70ca13a
  2. GitHub:https://github.com/SharkFin-top/PyTxtAcc_zh
  3. 更多内容:https://sharkfin.top/

GitHub内包含jupyter代码文件和本书英文原版。

英文版原书及代码.zip

3 全书目录

1. 引言

2. 在电脑中配置Python

3. Jupyter Notebook

4. Python编程语言简要介绍

5. 处理表数据:Pandas包

6 正则表达式介绍

7. 基于字典法的文本分析

8. 量化文本复杂度

9. 句子结构与分类

10. 测量文本相似度

11. 识别文本中的具体信息

12. 从网络中收集数据

致谢

参考文献

4 免责

所有内容仅限用于学习和研究目的,不得用于商业或者非法用途,否则,一切后果请用户自负。