热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型:complex布尔型:bool2.字符串字符串:String3.与

1.Python


1.数据类型


1.数字


  • 整形 : int
  • 浮点型: float
  • 复数型:complex
  • 布尔型: bool

2.字符串


  • 字符串:String

3.与Java的区别


  • python只有四种数据:整数,长整数、浮点数和复数

  • java则有char,short,byte,int,long,float,double类型


4.列表


  • 列表是一个有序的python对象序列

  • 列表的创建

    list1 = [1,2.0,'hello']

  • 列表的取值

    ##以上面的list为例
    list1[0]
    ##输出结果:1
    list1[list1.len()-1]
    ##输出结果:hello

  • 列表切片

    list2 = [1,2.0,3,4,5,6]
    list2[2,-1]
    ##输出结果:[3,4,5]

  • 列表元素的删除

    ##以上面的list为例
    del list2[0]
    ##输出结果:[2.0,3,4,5,6]

  • 常用方法

    ## 1.删除
    del list2[0]
    ## 2.返回列表中某元素出现个数
    list2.count(1)
    ## 3.返回元素出现的第一个位置
    list2.index('hello')
    ## 4.在列表最后追加元素
    list2.append('world')
    ## 5.删除列表指定位置的元素
    list2.pop(0)
    ## 6.对列表进行排序
    list2.sort()


5.元组


  • 元组的特点是:一旦创建,不可更改

  • 元组的创建

    ## 1.用一对括号创建元组
    t = (1,2,3,4,5)
    ## 2.元组的个数超过两个括号可以省略
    t = 1,2,3,4,5
    ## 3.注意当元组中元素个数只有一个括号不可省略
    t = (1)

  • 元组的取值

    ##以上面的t为例
    t[0]
    ##输出结果:1

  • 元组切片

    ##以上面的t为例
    t[1:3]
    ##输出结果:(3,4)

  • 由于元组的不可变性,所以没有插入等方法


6.字典


  • 字典是由“键-值”组成的数据结构

  • 注意:字典得到键时不可重复的,如果重复将会被最后一个覆盖掉,所以不会出现重复情况,同时字典是无序的

  • 字典的创建

    ## 1.创建空字典
    a = {}
    ## 2.直接赋值
    b = {'one':1,'two':2}

  • 用索引的方式向字典中插入元素

    ##以上面的a为例
    a['one'] = 1
    ##结果:a由原来的空字典变为含有一个元素的字典:{'one':1}

  • 也可以用上述方法进行赋值

  • 常用方法

    ##以上面的b为例
    ## 1.key()方法
    b.key()
    ##输出结果:['one','two']## 2.value()方法
    b.value()
    ##输出结果:[1,2]


2.循环


1.for循环


  • 循环固定次数

  • for i in range(5) :print(i)
    ##输出
    0
    1
    2
    3
    4

  • 遍历

  • languages = ["C", "C++", "Perl", "Python"]
    for x in languages:print (x)
    """
    结果
    C
    C++
    Perl
    Python
    >>>
    """


2.while循环


  • n = 100sum = 0
    counter = 1
    while counter <&#61; n:sum &#61; sum &#43; countercounter &#43;&#61; 1
    print("1 到 %d 之和为: %d" % (n,sum))##结果&#xff1a;1 到 100 之和为: 5050


3.正三角、倒三角源码


  • 右边

  • #右上角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,i):print(end &#61; " ")for j in rang(i,10):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#右下角三角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,10-i):print(end &#61; " ")for j in rang(1,10-i):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")

  • 左边

  • #左下三角个数输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#左上三角格式输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")


4.注意


  • python语法
  • 严格缩进
  • 循环后面由冒号

2.Pandas


1.基本概念


  • Series

    1. Series&#xff1a;Series也称序列&#xff0c;用于存储一行或一列数据&#xff0c;以及与之相关的索引集合

      Series([数据1,数据2,...],index &#61; [索引1,索引2,...])

    2. 注意以下几点

      • Series是一种类似一维数组的对象
      • 他的数据结构没有限制
      • 他有索引&#xff0c;类似于字典
      • Series同时兼具数字和字典的功能
  • DataFrame

    1. DataFrame是一种存储多行和多列数据的数据集合&#xff0c;是Series的容器

      from pandas import Series
      from pandas import DataFrame
      df &#61; DataFrame({&#39;age&#39;:Series([26,29,24]),&#39;name&#39;:Series([&#39;Ken&#39;,&#39;Jerry&#39;,&#39;Ben&#39;])},index&#61;[1,2,3])


2.分组分析


  • 分组分析&#xff1a;是指根据分组字段将分析对象划分成不同的部分&#xff0c;以对比分析各组之间的差异性的一种方法

  • 常用的方法有计数、求和、平均值

  • 常用形式

    df.groupby(by &#61; [&#39;分类1&#39;,&#39;分类2&#39;,...])[&#39;被统计的列&#39;].agg({列别名1&#xff1a;统计函数1&#xff0c;列别名2&#xff1a;统计函数2})

    df.groupby(by&#61;[u&#39;班级&#39;&#xff0c;u&#39;性别&#39;])[u&#39;军训&#39;].agg((u&#39;总分&#39;:numpy.sum,u&#39;人数&#39;:numpy.sizey,u&#39;平均值&#39;:nmpy.mean,u&#39;方差&#39;:numpy.var,u&#39;标准差&#39;:numpy.std,u&#39;最高分&#39;:umpy.max,u&#39;最低分&#39;:numpy&#xff0c;min))

    结果&#xff1a;


3.数据可视化


  • 散点图&#xff1a;散点图是以一个变量为横坐标&#xff0c;以另一个变量为纵坐标&#xff0c;利用散点&#xff08;坐标点&#xff09;的分布形态反映变量关系的一种图形。相关的方法如下&#xff1a;

    plt.plot(x,y,&#39;.&#39;,color&#61;(r,g,b)
    plt.xlabel(&#39;x轴坐标&#39;)
    plt.ylabel(&#39;y轴坐标&#39;)
    plt.grid(True)
    #其中&#xff0c;x、y为x轴和y轴的序列&#xff1a;&#39;.&#39;&#xff08;&#39;o&#39;等&#xff09;代表小点&#xff08;大点等&#xff09;&#xff1b;color为散点图的颜色&#xff0c;可以用RGB定义&#xff0c;也可以用英文字母定义RGB颜色的设置方式为&#xff08;red&#xff0c;green&#xff0c;blue&#xff09;

  • 折线图&#xff1a;P134


3.贝叶斯


推荐阅读
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件,并将其数据处理后存储到数据库中。通过实际案例,详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • Java 类成员初始化顺序与数组创建
    本文探讨了Java中类成员的初始化顺序、静态引入、可变参数以及finalize方法的应用。通过具体的代码示例,详细解释了这些概念及其在实际编程中的使用。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 本文介绍了如何在Python中使用join()方法将列表中的元素连接成一个字符串。join()方法允许用户指定分隔符,从而灵活地生成所需格式的字符串。此外,我们还将探讨一些实际应用中的注意事项和技巧。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 本文提供了一系列Python编程基础练习题,涵盖了列表操作、循环结构、字符串处理和元组特性等内容。通过这些练习题,读者可以巩固对Python语言的理解并提升编程技能。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 本文详细解析了如何使用Python的urllib模块发起POST请求,并通过实例展示如何爬取百度翻译的翻译结果。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • Java 数组及其常用操作
    本文详细介绍了 Java 中的数组类型、定义方法以及常见操作,帮助开发者更好地理解和使用 Java 数组。 ... [详细]
author-avatar
blg1202702934392
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有