热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

财务大赛数据分析师指南

大数据中心检索数据题1、仔细认真,不急,但也要有时间观念,越快完成越好2、理清楚逻辑,不行的直接就暴力丢excell里面去3、注意效率,后面的题会更加浪费时间4、及时与队友

大数据中心检索数据题

1、仔细认真,不急,但也要有时间观念,越快完成越好

2、理清楚逻辑,不行的直接就暴力丢excell里面去

3、注意效率,后面的题会更加浪费时间

4、及时与队友沟通,可以让队友帮忙

5、建议多进行自主训练,加快解题速度,提高解题准确率

编程检索数据题

ts_code的说明

600 开头的代码一般 是要以 .SH 结尾
上交所sh和深交所sz

总之在Python中一定要加上后缀 sz 或者 sh

monthly接口相关(月线接口)

一些参数

trade_date #交易日期
start_date #开始日期
end_date #结束日期
fields #最终需要的参数
open   #开盘价
high   #最高价
low    #最低价
close  #收盘价
pct_chg	# 未复权涨跌幅
import tushare as ts

pro = ts.pro_api(\'token\')

ds = pro.monthly(ts_code=\'600271.SH\', start_date=\'20131201\', end_date=\'20181231\', fields=\'trade_date,close\')

# 筛选数据
ds = ds[ds.trade_date.map(lambda x:x.find(\'12\',4,6)>=0)]

print(ds)

pro_bar 接口相关(通用行情接口)

一些参数

asset #资产类别:E股票 I沪深指数 C数字货币 FT期货 FD基金 O期权 CB可转债(v1.2.39),默认E
freq #数据频度 :支持分钟(min)/日(D)/周(W)/月(M)K线,其中1min表示1分钟(类推1/5/15/30/60分钟) ,默认D。
adj #复权类型(只针对股票):None未复权 qfq前复权 hfq后复权 , 默认None,目前只支持日线复权。
import tushare as ts
ts.set_token(\'token\')
ds = ts.pro_bar(ts_code=\'399101.SZ\', asset=\'I\', freq=\'M\', start_date=\'20130101\', end_date=\'20181231\')
# 其中 asset 为这个证券的类型,比如 E股票 I沪深指数,freq为数据频率(M代表月)

#筛选数据
ds = ds[ds.trade_date.map(lambda x:x.find(\'12\',4,6)>=0)]
ds = ds[[\'trade_date\',\'close\']]

print(ds)
import tushare as ts
import matplotlib as mp
import matplotlib.pyplot as plt
from pandas.plotting import register_matplotlib_converters
register_matplotlib_converters()

# 抓取数据
ds = ts.pro_bar(ts_code=\'002193.SZ\', start_date=\'20180601\', end_date=\'20180630\', adj=\'None\')
ds.to_csv(\'D:/bigdata/如意集团2018年6月公司股价变动日收盘价.csv\')
# 清洗数据
df = ds[[\'trade_date\', \'high\']]
df.to_csv(\'D:/bigdata/如意集团2018年6月公司股价变动日最高价(已清洗).csv\')
print(df)

# 为了防止出现中文乱码,在这里进行一下设置
plt.rcParams[\'font.sans-serif\']=[\'SimSun\']
plt.rcParams[\'axes.unicode_minus\']=False

#生成折线图
x_cel = ds[\'trade_date\'] #取值给曲线x
y_col1 = ds[\'open\'] #取值给y
y_col2 = ds[\'close\']
y_col3 = ds[\'high\']
plt.figure(figsize=(9, 7)) #定义画布尺寸
plt.plot_date(x_cel, y_col1, \'-\', label=\'open price\') #画线以及定义线的类型和命名
plt.plot_date(x_cel, y_col2, \'-\', label=\'closing price\')
plt.plot_date(x_cel, y_col3, \'-\', label=\'peak price\')
plt.xlabel(\'日期\') #给x和y轴命名
plt.ylabel(\'指数\') 
plt.legend()  #给图像加上图例
plt.xticks(rotation=45) #将x轴的图例坐标值,倾斜 45度放置
plt.style.use(\'ggplot\')  #设置背景样式
plt.grid(True) #显示网格线
plt.title(\'如意集团2018年6月开盘价收盘价最高价折线图\', fOntsize=10)
plt.savefig(\'D:/bigdata/如意集团开盘价收盘价最高折线图.png\')

balancesheet接口(资产负债表)

total_hldr_eqy_exc_min_int	#	股东权益合计(不含少数股东权益)
total_hldr_eqy_inc_min_int	#	股东权益合计(含少数股东权益)
total_liab	#	负债合计

题目

image

import tushare as ts
pro = ts.pro_api(\'token\')

df=pro.balancesheet(ts_code=\'300410.SZ\',start_date=\'20210101\', end_date=\'20210631\',fields=\'ts_code,end_date,total_hldr_eqy_inc_min_int,total_liab\')

df = df[df.end_date.map(lambda x:x.find(\'12\',4,6)>=0)]
df.to_csv(\'300410.csv\')
print(df)
产权比率=负债/权益=1570748408.55/629392801.51=2.5

根据资料的信息收集题

仔细阅读所给材料(一般是背景资料或者背景资料中的PDF)

PDF中也可进行文字搜索

寻找队友帮助

作者:~逍遥子~
本文连接: https://www.cnblogs.com/femme/p/15470833.html
版权:本人个人所有
转载请注明出处


推荐阅读
  • 本文详细介绍了如何使用Python中的xlwt库将数据库中的数据导出至Excel文件,适合初学者和中级开发者参考。 ... [详细]
  • python时间序列之ADF检验(1)
    读取数据,pd.read_csv默认生成DataFrame对象,需将其转换成Series对象DataFrame和Series是pandas中最常见的2 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • python的交互模式怎么输出名文汉字[python常见问题]
    在命令行模式下敲命令python,就看到类似如下的一堆文本输出,然后就进入到Python交互模式,它的提示符是>>>,此时我们可以使用print() ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文将介绍由密歇根大学Charles Severance教授主讲的顶级Python入门系列课程,该课程广受好评,被誉为Python学习的最佳选择。通过生动有趣的教学方式,帮助初学者轻松掌握编程基础。 ... [详细]
  • 本文详细介绍了Python中文件的基本操作,包括打开、读取、写入和关闭文件的方法,并通过实例展示了如何将Excel文件转换为CSV文件以及进一步转换为HTML文件。此外,还涉及了成绩等级替换的具体实现。 ... [详细]
  • 本文介绍如何使用 Python 获取文件和图片的创建、修改及拍摄日期。通过多种方法,如 PIL 库的 _getexif() 函数和 os 模块的 getmtime() 和 stat() 方法,详细讲解了这些技术的应用场景和注意事项。 ... [详细]
  • 本文介绍如何使用 Python 的 Pandas 库中 Series 对象的 round() 方法,对数值进行四舍五入处理。该方法在数据预处理和分析中非常有用。 ... [详细]
  • 本文介绍了MindManager在项目管理中的强大功能,特别是其内置的甘特图工具。通过该工具,用户可以轻松创建和管理项目计划,优化任务分配,并与其他软件无缝集成。 ... [详细]
  • ABBYY FineReader:高效PDF转换、精准OCR识别与文档对比工具
    在处理PDF转换和OCR识别时,您是否遇到过格式混乱、识别率低或图表无法正常识别的问题?ABBYY FineReader以其强大的功能和高精度的识别技术,完美解决这些问题,帮助您轻松找到最终版文档。 ... [详细]
  • ˂p优秀的马里奥YouprobablywanttomakethecreationoftheformuladynamicsoeachrowofCta ... [详细]
  • 虽然SQL因其直观易学的语法受到广泛欢迎,但转向Pandas进行数据处理时,初学者可能会感到不适应。本文旨在通过一系列实例,展示如何在Pandas中实现类似SQL的数据查询功能。 ... [详细]
  • 利用R语言进行股票价格数据的线性回归分析
    本文介绍了如何使用R语言对Excel中的股票价格数据集执行线性回归分析。通过具体的代码示例,展示了数据的导入、处理及模型构建的过程。 ... [详细]
  • Apache IoTDB:开源工业物联网数据库的崛起
    2020年9月23日,全球领先的开源软件基金会——Apache软件基金会宣布,Apache IoTDB正式成为其顶级项目。Apache IoTDB是一款专为大规模物联网和工业物联网设计的开源数据库。 ... [详细]
author-avatar
吴盛雪佩儒政义
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有