热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

要做一个驾考考试系统怎么建数据库题库就是那1000多道题批量导入数据库中

JavaBS怎么上传一个pdf文件并将里面的内容读取出来写入到数据库中求解
Java B/S  怎么上传一个pdf文件  并将里面的内容读取出来写入到数据库中            求解

4 个解决方案

#1


读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了

#2


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库

#3


引用 1 楼 cgs1999 的回复:
读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库

#4


引用 3 楼 yx179141043 的回复:
Quote: 引用 1 楼 cgs1999 的回复:

读取pdf可以使用poi或itext进行处理,但要实现导入的话,就要看pdf中题库是否有规律了,没规律的话基本没戏。

一般导入的是cvs或excel文件,处理起来比较方便
导入pdf格式的还真没处理过,主要还是要解析pdf文件的内容为试题,处理起来就会比较麻烦了


pdf题库有规律    pdf内容是试题  标号  题目  选项   之类的东西  用什么方法解析导入数据库


读取pdf的内容,可参考下面的文章
http://kailab.blog.163.com/blog/static/189695071201131452038876/

至于怎么解析,可以直接将pdf文件的文本读取出来,然后对文本内容进行解析,几种解析方法:
(1)逐行文本解析,如行内容有标号,则识别为题目,如行内容有A、B、C、D之类的内容格式,则识别为题目的选项...;
(2)逐块文本解析,若pdf中的题目很有规律,比如每5行一题(题目1行,4个选项每行一个选项,共5行),那么处理时就可以每5行作为一块进行解析处理;
(3)使用正则表达式进行解析,编写题目的正则表达式,然后将pdf文本内容中,正则表达式匹配的内容拿出来逐个作为一个题目进行解析处理;

推荐阅读
author-avatar
mobiledu2502887427
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有