前言:有了上一篇的理论基础,我们正式开始动手实践。作为张靓颖的六十年铁杆歌迷,我们这次就拿“小海豚”做实验,看看能不能用RNN写出来自己的靓式情歌。
爬取张靓颖歌词数据集
用爬虫爬取,QQ音乐上爬取的。QQ音乐很良心,没有多少反爬措施。
爬下来的数据存到我们data.txt中:
#!/usr/bin/python
# -*- coding:utf-8 -*-
import requests
import json
import pymongo
import time
import os
f = open('data.txt', 'w+')def main(page):print(page)url = 'https://c.y.qq.com/soso/fcgi-bin/client_s