热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用python进行自动化打分

数据挖掘研讨课结束了,这门课的考核方法是每个同学根据班里面同学的课堂表现打分,然后老师再取截断平均值作为最后的分数。于是我就想,能否用p

数据挖掘研讨课结束了,这门课的考核方法是每个同学根据班里面同学的课堂表现打分,然后老师再取截断平均值作为最后的分数。

于是我就想,能否用python进行自动化打分呢,答案是肯定的。

老师发给我们的课堂发言记录是pdf格式,首先我在网上下载了迅捷pdf转word工具,由于这个不付费只能一次转5页,所以我又下载了迅捷pdf编辑器,一次删除5页图片,最后将数据汇总到txt中。

通过观察可以很容易发现,记录中记录同学信息的格式是(xxx, xxx,xxx),于是可以使用python将所有同学信息提取出来,并且统计每个同学的回答频率,最后根据回答频率给出分数。

打分表是一张xlsx格式的表格,那里面详细记录了同学学号,姓名和班级信息,将上述过程计算得到的分数和信息录入数据库,然后再根据表格的学号在数据库中查询成绩,再录入表格中,这样,就大功告成啦。

python使用到的库:

xlrd xls读取库

xlwt xls写入库

pymysql python操作mysql库

xlutils 表格复制库

具体代码如下:

#coding:utf-8import xlrd
import xlwt
from xlutils.copy import copy
import pymysql.cursors#提取出()的内容
def extract():with open("学生记录.txt","w") as data:with open("数据挖掘课程记录.txt", "r") as file:lines = file.readlines() #读取每一行for line in lines: #从每一行中读取出()内容if(line.find("(") != -1):tuple = line.split("(")[1].split(")")[0]data.write(tuple) #些许数据文件data.write("\n")#对提取的数据进行数据清洗
#返回回答频率字典name
def cleanout():with open("学生记录.txt","r") as data:#统计每个同学出现次数name = {}lines = data.readlines()for line in lines:print(line)if(line.find(",") != -1):st = line.split(",")[1]print(st)if st in name: #如果已经记录了这个名字就将频率加一print("在")name[st] = name[st] + 1else: #否则就加入字典print("不在")name[st] = 1print(name)#接着写入成绩文件return name#将数据录入数据库中
def entering(name = {}):#连接数据库connection = pymysql.connect(host = "localhost",user = "root",password = "root",db = "mark")data = []try:with connection.cursor() as cur:with open("学生记录.txt","r") as file:lines = file.readlines()for line in lines:if(line.find(",") != -1):data = []data.append(line.split(",")[0])data.append(line.split(",")[1])data.append(line.split(",")[2])num = name[data[1]]print(name[data[1]])if(num == 1):grad = 94elif(num == 2):grad = 96elif(num == 3):grad = 98elif(num == 4):grad = 100print(grad)print(data[0])print(data[1])print(data[2])id = int(data[0])sel = "SELECT * FROM grade WHERE id = %s"sul = cur.execute(sel, id)if(sul == 0):sql = "INSERT INTO grade values(%s,%s,%s,%s)"cur.execute(sql, (id,data[1],data[2],grad))connection.commit() #提交事务finally:connection.close()#接着按照数据库的成绩写入excel表格中
def wtexcel():connection = pymysql.connect(host = "localhost",user = "root",password = "root",db = "mark")try:with connection.cursor() as cur:file = xlrd.open_workbook("2018秋打分表weiweihit@163.com.xlsx")table = file.sheets()[0]nrows = table.nrowswb = copy(file)sheet = wb.get_sheet(0)for row in range(1, nrows):#print(row)id = int(table.cell(row, 1).value)sel = "SELECT grade FROM grade WHERE id = %s"sul = cur.execute(sel, id)grad = cur.fetchone()if(sul == 0): #没有记录就是75分sheet.write(row, 4, 75)else:sheet.write(row, 4, grad[0])wb.save("打分表.xls")finally:connection.close()if __name__=="__main__":#extract()#cleanout()#name = {}#name = cleanout()#entering(name)wtexcel()

 


推荐阅读
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 使用Pandas高效读取SQL脚本中的数据
    本文详细介绍了如何利用Pandas直接读取和解析SQL脚本,提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本,并且能够显著提升数据导入的速度和效率。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 本文详细介绍了如何通过多种编程语言(如PHP、JSP)实现网站与MySQL数据库的连接,包括创建数据库、表的基本操作,以及数据的读取和写入方法。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本,并进行数据处理和保存。 ... [详细]
  • MySQL缓存机制深度解析
    本文详细探讨了MySQL的缓存机制,包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术,读者可以更好地优化数据库性能。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文介绍如何使用Python进行文本处理,包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图,展示文本数据的可视化分析方法。 ... [详细]
  • 解决网站乱码问题的综合指南
    本文总结了导致网站乱码的常见原因,并提供了详细的解决方案,包括文件编码、HTML元标签设置、服务器响应头配置、数据库字符集调整以及PHP与MySQL交互时的编码处理。 ... [详细]
  • PostgreSQL 10 离线安装指南
    本文详细介绍了如何在无法联网的服务器上进行 PostgreSQL 10 的离线安装,并涵盖了从下载安装包到配置远程访问的完整步骤。 ... [详细]
author-avatar
多米音乐_34024963
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有