python爬取数据情感分析_爬虫再探实战（五）———爬取APP数据——超级课程表【四】——情感分析...

作者：谷饶潮流服装HLGC | 来源：互联网 | 2023-08-13 18:43

仔细看的话，会发现之前的词频分析并没有什么卵用。。。文本分析真正的大哥是NLP，不过，这个坑太大，小白不大敢跳。。。不过还是

仔细看的话&＃xff0c;会发现之前的词频分析并没有什么卵用。。。文本分析真正的大哥是NLP&＃xff0c;不过&＃xff0c;这个坑太大&＃xff0c;小白不大敢跳。。。不过还是忍不住在坑边上往下瞅瞅2333.

言归正传&＃xff0c;今天刚了解到boson公司有python关于自然语言处理的API&＃xff0c;于是试着用了一下&＃xff0c;官方文档很不错&＃xff0c;简单明了。首先是pip install bosonnlp。下面是一些简单应用&＃xff0c;其实就是改一点官方的例子Orz...密钥的话&＃xff0c;我的不给看(因为有请求次数限制的。。。)&＃xff0c;自己在这里注册一下就有啦。

# -*- coding: utf-8 -*-

# 情感分析

from __future__ import print_function, unicode_literals

from bosonnlp import BosonNLP

nlp &＃61; BosonNLP(&＃39;这里应该是你的密钥&＃39;)

print(nlp.sentiment("楼主真是帅啊"))

print(nlp.sentiment("楼主真是太弱了"))

输出如下&＃xff1a;

两个列表对应着两句话&＃xff0c;列表里面的两个数字&＃xff0c;分别为正面指数&＃xff0c;负面指数。额。。那个结果&＃xff0c;&＃xff0c;还算是挺合理的吧。

也可以换个姿势&＃xff0c;再请求一遍这两段文本&＃xff1a;

import json

import requests

SENTIMENT_URL &＃61; &＃39;http://api.bosonnlp.com/sentiment/analysis&＃39;

# 注意&＃xff1a;在测试时请更换为您的API Token

headers &＃61; {&＃39;X-Token&＃39;: &＃39;这里应该是你的密钥&＃39;}

s &＃61; [&＃39;楼主真是帅啊&＃39;, &＃39;楼主真是太弱了&＃39;]

data &＃61; json.dumps(s)

resp &＃61; requests.post(SENTIMENT_URL, headers&＃61;headers, data&＃61;data.encode(&＃39;utf-8&＃39;))

print(resp.text)

输出结果也是一样的&＃xff1a;

还有很多有趣的用法&＃xff0c;这个就留在以后有空的时候再深入研究啦。

这个&＃xff0c;其实我还是想分析一下那些帖子的文本信息&＃xff0c;用API做当然可以&＃xff0c;不过那样虽然严谨&＃xff0c;但是&＃xff0c;没有直接利用boson提供的页面解析文本方便些。

于是&＃xff0c;我就开始了&＃xff0c;无耻的粘贴和复制。。。效果如下&＃xff1a;

这个关键词提取还是可以的2333。。。其中精髓&＃xff0c;自己联想吧&＃xff01;不过&＃xff0c;也许是自己太与世隔绝orz。。。不明白dogo是什么&＃xff0c;查了下&＃xff0c;不解释啦&＃xff0c;是它&＃xff01;

至此&＃xff0c;和超级课程表的交集就算完结了。

推荐阅读

format
WordPress Duplicator 0.4.4 版本存在跨站脚本攻击漏洞分析

在对WordPress Duplicator插件0.4.4版本的安全评估中，发现其存在跨站脚本（XSS）攻击漏洞。此漏洞可能被利用进行恶意操作，建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的，使用时需自行承担风险。漏洞编号：HTB23162。 ... [详细]

蜡笔小新 2024-11-10 13:16:43
tree
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
utf-8
使用ArcGIS for Java和Flex浏览自定义ArcGIS Server 9.3地图

本文介绍了如何在Flex应用程序中实现浏览自定义ArcGIS Server 9.3发布的地图。这是一个基本的入门示例，适用于初学者。 ... [详细]

蜡笔小新 2024-11-13 14:40:13
web
SpringMVC 入门指南：快速上手 Java Web 开发

本文将带你快速了解 SpringMVC 框架的基本使用方法，通过实现一个简单的 Controller 并在浏览器中访问，展示 SpringMVC 的强大与简便。 ... [详细]

蜡笔小新 2024-11-13 14:22:01
utf-8
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
substring
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
utf-8
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
version
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
utf-8
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
dll
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
utf-8
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
web
JavaWeb文件上传：前端实现与后端处理详解

在JavaWeb开发中，文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件，都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件，该库提供了强大的文件解析和存储能力，能够高效地处理各种文件类型。此外，为了提高系统的安全性和稳定性，还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]

蜡笔小新 2024-11-11 19:50:46
utf-8
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23
utf-8
利用 Node.js 和 Express（4.x 及以上版本）构建高效文件上传功能

本文介绍了如何使用 Node.js 和 Express（4.x 及以上版本）构建高效的文件上传功能。通过引入 `multer` 中间件，可以轻松实现文件上传。首先，需要通过 `npm install multer` 安装该中间件。接着，在 Express 应用中配置 `multer`，以处理多部分表单数据。本文详细讲解了 `multer` 的基本用法和高级配置，帮助开发者快速搭建稳定可靠的文件上传服务。 ... [详细]

蜡笔小新 2024-11-11 18:02:17
input
在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解

在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解 ... [详细]

蜡笔小新 2024-11-11 17:28:29

谷饶潮流服装HLGC

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章