热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型:complex布尔型:bool2.字符串字符串:String3.与

1.Python


1.数据类型


1.数字


  • 整形 : int
  • 浮点型: float
  • 复数型:complex
  • 布尔型: bool

2.字符串


  • 字符串:String

3.与Java的区别


  • python只有四种数据:整数,长整数、浮点数和复数

  • java则有char,short,byte,int,long,float,double类型


4.列表


  • 列表是一个有序的python对象序列

  • 列表的创建

    list1 = [1,2.0,'hello']

  • 列表的取值

    ##以上面的list为例
    list1[0]
    ##输出结果:1
    list1[list1.len()-1]
    ##输出结果:hello

  • 列表切片

    list2 = [1,2.0,3,4,5,6]
    list2[2,-1]
    ##输出结果:[3,4,5]

  • 列表元素的删除

    ##以上面的list为例
    del list2[0]
    ##输出结果:[2.0,3,4,5,6]

  • 常用方法

    ## 1.删除
    del list2[0]
    ## 2.返回列表中某元素出现个数
    list2.count(1)
    ## 3.返回元素出现的第一个位置
    list2.index('hello')
    ## 4.在列表最后追加元素
    list2.append('world')
    ## 5.删除列表指定位置的元素
    list2.pop(0)
    ## 6.对列表进行排序
    list2.sort()


5.元组


  • 元组的特点是:一旦创建,不可更改

  • 元组的创建

    ## 1.用一对括号创建元组
    t = (1,2,3,4,5)
    ## 2.元组的个数超过两个括号可以省略
    t = 1,2,3,4,5
    ## 3.注意当元组中元素个数只有一个括号不可省略
    t = (1)

  • 元组的取值

    ##以上面的t为例
    t[0]
    ##输出结果:1

  • 元组切片

    ##以上面的t为例
    t[1:3]
    ##输出结果:(3,4)

  • 由于元组的不可变性,所以没有插入等方法


6.字典


  • 字典是由“键-值”组成的数据结构

  • 注意:字典得到键时不可重复的,如果重复将会被最后一个覆盖掉,所以不会出现重复情况,同时字典是无序的

  • 字典的创建

    ## 1.创建空字典
    a = {}
    ## 2.直接赋值
    b = {'one':1,'two':2}

  • 用索引的方式向字典中插入元素

    ##以上面的a为例
    a['one'] = 1
    ##结果:a由原来的空字典变为含有一个元素的字典:{'one':1}

  • 也可以用上述方法进行赋值

  • 常用方法

    ##以上面的b为例
    ## 1.key()方法
    b.key()
    ##输出结果:['one','two']## 2.value()方法
    b.value()
    ##输出结果:[1,2]


2.循环


1.for循环


  • 循环固定次数

  • for i in range(5) :print(i)
    ##输出
    0
    1
    2
    3
    4

  • 遍历

  • languages = ["C", "C++", "Perl", "Python"]
    for x in languages:print (x)
    """
    结果
    C
    C++
    Perl
    Python
    >>>
    """


2.while循环


  • n = 100sum = 0
    counter = 1
    while counter <&#61; n:sum &#61; sum &#43; countercounter &#43;&#61; 1
    print("1 到 %d 之和为: %d" % (n,sum))##结果&#xff1a;1 到 100 之和为: 5050


3.正三角、倒三角源码


  • 右边

  • #右上角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,i):print(end &#61; " ")for j in rang(i,10):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#右下角三角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,10-i):print(end &#61; " ")for j in rang(1,10-i):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")

  • 左边

  • #左下三角个数输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#左上三角格式输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")


4.注意


  • python语法
  • 严格缩进
  • 循环后面由冒号

2.Pandas


1.基本概念


  • Series

    1. Series&#xff1a;Series也称序列&#xff0c;用于存储一行或一列数据&#xff0c;以及与之相关的索引集合

      Series([数据1,数据2,...],index &#61; [索引1,索引2,...])

    2. 注意以下几点

      • Series是一种类似一维数组的对象
      • 他的数据结构没有限制
      • 他有索引&#xff0c;类似于字典
      • Series同时兼具数字和字典的功能
  • DataFrame

    1. DataFrame是一种存储多行和多列数据的数据集合&#xff0c;是Series的容器

      from pandas import Series
      from pandas import DataFrame
      df &#61; DataFrame({&#39;age&#39;:Series([26,29,24]),&#39;name&#39;:Series([&#39;Ken&#39;,&#39;Jerry&#39;,&#39;Ben&#39;])},index&#61;[1,2,3])


2.分组分析


  • 分组分析&#xff1a;是指根据分组字段将分析对象划分成不同的部分&#xff0c;以对比分析各组之间的差异性的一种方法

  • 常用的方法有计数、求和、平均值

  • 常用形式

    df.groupby(by &#61; [&#39;分类1&#39;,&#39;分类2&#39;,...])[&#39;被统计的列&#39;].agg({列别名1&#xff1a;统计函数1&#xff0c;列别名2&#xff1a;统计函数2})

    df.groupby(by&#61;[u&#39;班级&#39;&#xff0c;u&#39;性别&#39;])[u&#39;军训&#39;].agg((u&#39;总分&#39;:numpy.sum,u&#39;人数&#39;:numpy.sizey,u&#39;平均值&#39;:nmpy.mean,u&#39;方差&#39;:numpy.var,u&#39;标准差&#39;:numpy.std,u&#39;最高分&#39;:umpy.max,u&#39;最低分&#39;:numpy&#xff0c;min))

    结果&#xff1a;


3.数据可视化


  • 散点图&#xff1a;散点图是以一个变量为横坐标&#xff0c;以另一个变量为纵坐标&#xff0c;利用散点&#xff08;坐标点&#xff09;的分布形态反映变量关系的一种图形。相关的方法如下&#xff1a;

    plt.plot(x,y,&#39;.&#39;,color&#61;(r,g,b)
    plt.xlabel(&#39;x轴坐标&#39;)
    plt.ylabel(&#39;y轴坐标&#39;)
    plt.grid(True)
    #其中&#xff0c;x、y为x轴和y轴的序列&#xff1a;&#39;.&#39;&#xff08;&#39;o&#39;等&#xff09;代表小点&#xff08;大点等&#xff09;&#xff1b;color为散点图的颜色&#xff0c;可以用RGB定义&#xff0c;也可以用英文字母定义RGB颜色的设置方式为&#xff08;red&#xff0c;green&#xff0c;blue&#xff09;

  • 折线图&#xff1a;P134


3.贝叶斯


推荐阅读
  • NGUIusingSystem;usingUnityEng ... [详细]
  • 线性代数:机器学习背后的优化原理线性代数作为数学的一个分支,广泛应用于科学和工程中,掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]
  • RabbitMQ之队列与消息持久化
    队列持久化在之前的例子中,我们所用的队列都是临时队列,当服务重启后之前创建的队列就都没有了。队列的持久化是在定义队列时的第二个参数决定的(false为队列不用持久化)channel.queueDecl ... [详细]
  • 深度强化学习Policy Gradient基本实现
    全文共2543个字,2张图,预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态,计算采取每个动作的价值,然 ... [详细]
  • 一、腐烂的橘子1、题目描 ... [详细]
  • 介绍项目开发过程中,一个不可避免的问题就是密码安全问题。实际上,我们经常能看到很多新闻的密码泄露事件,很多传统的企业密码采用明文存储&#x ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 怎么在PHP项目中实现一个HTTP断点续传功能发布时间:2021-01-1916:26:06来源:亿速云阅读:96作者:Le ... [详细]
  • String字符串java.lang;基本标识Java字符串的一个重要特点就是字符串不可变。finalclassString没有子类字符串字面量也是一个String类的实例存储在字 ... [详细]
  • iOS8之后系统把UIActionSheet和UIAlertView合并为了UIAlertController,使用就不比多说了,但在使用的过程中发现样式是固定的,点 ... [详细]
  • 关于初学PHP时的知识积累总结【PHP】
    后端开发|php教程PHP,知识积累后端开发-php教程PHP基础A、初识PHPPHP是与HTML混合使用的嵌入式语言。1、PHP标记默认标记短标记,需在php.ini中将shor ... [详细]
  • 稀松数组
    稀松数组1.稀松数组什么?在一个数组中,若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则称该数组为稀疏数组;如图,一个5*5的数组arr上只有3个有效数值 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
author-avatar
blg1202702934392
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有