热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型:complex布尔型:bool2.字符串字符串:String3.与

1.Python


1.数据类型


1.数字


  • 整形 : int
  • 浮点型: float
  • 复数型:complex
  • 布尔型: bool

2.字符串


  • 字符串:String

3.与Java的区别


  • python只有四种数据:整数,长整数、浮点数和复数

  • java则有char,short,byte,int,long,float,double类型


4.列表


  • 列表是一个有序的python对象序列

  • 列表的创建

    list1 = [1,2.0,'hello']

  • 列表的取值

    ##以上面的list为例
    list1[0]
    ##输出结果:1
    list1[list1.len()-1]
    ##输出结果:hello

  • 列表切片

    list2 = [1,2.0,3,4,5,6]
    list2[2,-1]
    ##输出结果:[3,4,5]

  • 列表元素的删除

    ##以上面的list为例
    del list2[0]
    ##输出结果:[2.0,3,4,5,6]

  • 常用方法

    ## 1.删除
    del list2[0]
    ## 2.返回列表中某元素出现个数
    list2.count(1)
    ## 3.返回元素出现的第一个位置
    list2.index('hello')
    ## 4.在列表最后追加元素
    list2.append('world')
    ## 5.删除列表指定位置的元素
    list2.pop(0)
    ## 6.对列表进行排序
    list2.sort()


5.元组


  • 元组的特点是:一旦创建,不可更改

  • 元组的创建

    ## 1.用一对括号创建元组
    t = (1,2,3,4,5)
    ## 2.元组的个数超过两个括号可以省略
    t = 1,2,3,4,5
    ## 3.注意当元组中元素个数只有一个括号不可省略
    t = (1)

  • 元组的取值

    ##以上面的t为例
    t[0]
    ##输出结果:1

  • 元组切片

    ##以上面的t为例
    t[1:3]
    ##输出结果:(3,4)

  • 由于元组的不可变性,所以没有插入等方法


6.字典


  • 字典是由“键-值”组成的数据结构

  • 注意:字典得到键时不可重复的,如果重复将会被最后一个覆盖掉,所以不会出现重复情况,同时字典是无序的

  • 字典的创建

    ## 1.创建空字典
    a = {}
    ## 2.直接赋值
    b = {'one':1,'two':2}

  • 用索引的方式向字典中插入元素

    ##以上面的a为例
    a['one'] = 1
    ##结果:a由原来的空字典变为含有一个元素的字典:{'one':1}

  • 也可以用上述方法进行赋值

  • 常用方法

    ##以上面的b为例
    ## 1.key()方法
    b.key()
    ##输出结果:['one','two']## 2.value()方法
    b.value()
    ##输出结果:[1,2]


2.循环


1.for循环


  • 循环固定次数

  • for i in range(5) :print(i)
    ##输出
    0
    1
    2
    3
    4

  • 遍历

  • languages = ["C", "C++", "Perl", "Python"]
    for x in languages:print (x)
    """
    结果
    C
    C++
    Perl
    Python
    >>>
    """


2.while循环


  • n = 100sum = 0
    counter = 1
    while counter <&#61; n:sum &#61; sum &#43; countercounter &#43;&#61; 1
    print("1 到 %d 之和为: %d" % (n,sum))##结果&#xff1a;1 到 100 之和为: 5050


3.正三角、倒三角源码


  • 右边

  • #右上角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,i):print(end &#61; " ")for j in rang(i,10):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#右下角三角格式输出九九乘法表
    for i in rang(1,10):for k in rang(1,10-i):print(end &#61; " ")for j in rang(1,10-i):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")

  • 左边

  • #左下三角个数输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")#左上三角格式输出九九乘法表
    for i in rang(1,10):for j in rang(1,i&#43;1):print("%d*%d &#61; %2d" % (i,j,i*j),end&#61;" ")print(" ")


4.注意


  • python语法
  • 严格缩进
  • 循环后面由冒号

2.Pandas


1.基本概念


  • Series

    1. Series&#xff1a;Series也称序列&#xff0c;用于存储一行或一列数据&#xff0c;以及与之相关的索引集合

      Series([数据1,数据2,...],index &#61; [索引1,索引2,...])

    2. 注意以下几点

      • Series是一种类似一维数组的对象
      • 他的数据结构没有限制
      • 他有索引&#xff0c;类似于字典
      • Series同时兼具数字和字典的功能
  • DataFrame

    1. DataFrame是一种存储多行和多列数据的数据集合&#xff0c;是Series的容器

      from pandas import Series
      from pandas import DataFrame
      df &#61; DataFrame({&#39;age&#39;:Series([26,29,24]),&#39;name&#39;:Series([&#39;Ken&#39;,&#39;Jerry&#39;,&#39;Ben&#39;])},index&#61;[1,2,3])


2.分组分析


  • 分组分析&#xff1a;是指根据分组字段将分析对象划分成不同的部分&#xff0c;以对比分析各组之间的差异性的一种方法

  • 常用的方法有计数、求和、平均值

  • 常用形式

    df.groupby(by &#61; [&#39;分类1&#39;,&#39;分类2&#39;,...])[&#39;被统计的列&#39;].agg({列别名1&#xff1a;统计函数1&#xff0c;列别名2&#xff1a;统计函数2})

    df.groupby(by&#61;[u&#39;班级&#39;&#xff0c;u&#39;性别&#39;])[u&#39;军训&#39;].agg((u&#39;总分&#39;:numpy.sum,u&#39;人数&#39;:numpy.sizey,u&#39;平均值&#39;:nmpy.mean,u&#39;方差&#39;:numpy.var,u&#39;标准差&#39;:numpy.std,u&#39;最高分&#39;:umpy.max,u&#39;最低分&#39;:numpy&#xff0c;min))

    结果&#xff1a;


3.数据可视化


  • 散点图&#xff1a;散点图是以一个变量为横坐标&#xff0c;以另一个变量为纵坐标&#xff0c;利用散点&#xff08;坐标点&#xff09;的分布形态反映变量关系的一种图形。相关的方法如下&#xff1a;

    plt.plot(x,y,&#39;.&#39;,color&#61;(r,g,b)
    plt.xlabel(&#39;x轴坐标&#39;)
    plt.ylabel(&#39;y轴坐标&#39;)
    plt.grid(True)
    #其中&#xff0c;x、y为x轴和y轴的序列&#xff1a;&#39;.&#39;&#xff08;&#39;o&#39;等&#xff09;代表小点&#xff08;大点等&#xff09;&#xff1b;color为散点图的颜色&#xff0c;可以用RGB定义&#xff0c;也可以用英文字母定义RGB颜色的设置方式为&#xff08;red&#xff0c;green&#xff0c;blue&#xff09;

  • 折线图&#xff1a;P134


3.贝叶斯


推荐阅读
  • 本文探讨了如何使用Scrapy框架构建高效的数据采集系统,以及如何通过异步处理技术提升数据存储的效率。同时,文章还介绍了针对不同网站采用的不同采集策略。 ... [详细]
  • 通过命令行执行Robot Framework测试用例的方法
    本文介绍如何利用命令行工具来运行Robot Framework中的测试文件及用例,解决常见的模块未找到错误。 ... [详细]
  • STM32代码编写STM32端不需要写关于连接MQTT服务器的代码,连接的工作交给ESP8266来做,STM32只需要通过串口接收和发送数据,间接的与服务器交互。串口三配置串口一已 ... [详细]
  • iOS如何实现手势
    这篇文章主要为大家展示了“iOS如何实现手势”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“iOS ... [详细]
  • Java连接MySQL数据库的方法及测试示例
    本文详细介绍了如何安装MySQL数据库,并通过Java编程语言实现与MySQL数据库的连接,包括环境搭建、数据库创建以及简单的查询操作。 ... [详细]
  • 本文详细介绍了如何在PyQt5中创建简易对话框,包括对话框的基本结构、布局管理以及源代码实现。通过实例代码,展示了如何设置窗口部件、布局方式及对话框的基本操作。 ... [详细]
  • 本文探讨了在已知最终数组尺寸不会超过5000x10的情况下,如何利用预分配和调整大小的方法来优化Numpy数组的创建过程,以提高性能并减少内存消耗。 ... [详细]
  • 一、使用Microsoft.Office.Interop.Excel.DLL需要安装Office代码如下:2publicstaticboolExportExcel(S ... [详细]
  • Python网络编程:深入探讨TCP粘包问题及解决方案
    本文详细探讨了TCP协议下的粘包现象及其产生的原因,并提供了通过自定义报头解决粘包问题的具体实现方案。同时,对比了TCP与UDP协议在数据传输上的不同特性。 ... [详细]
  • 设计一个算法,用于计算给定字符串中出现的不同ASCII字符数量。该任务将重点考察字符串处理、集合操作以及基础的输入输出技术。 ... [详细]
  • 本文详细探讨了在Windows 98环境下安装Apache 1.3.9、JServ、GNUJSP 1.0、JDK 1.2.2及JSDK 2.0后遇到的中文显示问题,并提供了多种有效的解决方案。 ... [详细]
  • Python环境下OpenCV的安装与验证方法
    本文介绍了如何在Python环境中安装OpenCV库及其额外模块,并提供了验证安装是否成功的具体步骤和代码示例。 ... [详细]
  • 本文探讨了如何利用 Android 的 Movie 类来展示 GIF 动画,并详细介绍了调整 GIF 尺寸以适应不同布局的方法。同时,提供了相关的代码示例和注意事项。 ... [详细]
  • 本文介绍了如何使用 Python 的 Pyglet 库加载并显示图像。Pyglet 是一个用于开发图形用户界面应用的强大工具,特别适用于游戏和多媒体项目。 ... [详细]
  • 本文详细介绍如何在SSM(Spring + Spring MVC + MyBatis)框架中实现分页功能。包括分页的基本概念、数据准备、前端分页栏的设计与实现、后端分页逻辑的编写以及最终的测试步骤。 ... [详细]
author-avatar
blg1202702934392
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有