比Python快100倍，利用Cython实现高速NLP项目

作者：我的双宝宝_486 | 来源：互联网 | 2023-09-04 14:42

原文https:juejin.impost5b4c3a6de51d4519044a6765选自Medium，作者：ThomasWolf，

原文 https://juejin.im/post/5b4c3a6de51d4519044a6765

选自Medium&＃xff0c;作者&＃xff1a;Thomas Wolf&＃xff0c;机器之心编译。

Cython 是一个工具包&＃xff0c;可以使你在 Python 中编译 C 语言&＃xff0c;这就是为什么 numpy 和 pandas 很快的原因&＃xff0c;Cython 就是 Python 的超集。在本文中&＃xff0c;作者将为我们介绍他的 GitHub 项目 NeuralCoref v3.0&＃xff0c;详解如何利用 spaCy 和 Cython 以约 100 倍于 Python 的速度实现 NLP 项目。

相关 Jupyter Notebook 地址&＃xff1a;github.com/huggingface…

去年我们发布 Python 包 coreference resolution package 后&＃xff0c;我们收到了来自社区的精彩反馈&＃xff0c;并且人们开始在很多应用中使用它&＃xff0c;其中一些与我们原来的对话用例迥异。

我们发现&＃xff0c;尽管对话信息的处理速度非常好&＃xff0c;但对于长的新闻文章来说&＃xff0c;处理速度可能会非常慢。

我决定详细研究这一问题&＃xff0c;最终成果即 NeuralCoref v3.0&＃xff0c;它在相同准确率的情况下比老版本快 100 倍左右&＃xff08;每秒几千字&＃xff09;&＃xff0c;同时兼顾 Python 库的易用性和兼容性。

NeuralCoref v3.0 &＃xff1a;github.com/huggingface…

我想在这篇文章中分享一些关于这个项目的经验&＃xff0c;特别是&＃xff1a;

如何用 Python 设计一个高速模块&＃xff1b;
如何利用 spaCy 的内部数据结构来有效地设计超高速 NLP 函数。

所以我在这里有点作弊&＃xff0c;因为我们会谈论 Python&＃xff0c;但也谈论一些 Cython 的神奇作用。但是&＃xff0c;你知道吗&＃xff1f;Cython 是 Python 的超集&＃xff0c;所以不要让它吓跑你&＃xff01;

你现在的 Python 程序已经是 Cython 程序。

有几种情况下你可能需要加速&＃xff0c;例如&＃xff1a;

你正在使用 Python 开发一个 NLP 的生产模块&＃xff1b;
你正在使用 Python 计算分析大型 NLP 数据集&＃xff1b;
你正在为深度学习框架&＃xff0c;如 PyTorch / TensorFlow&＃xff0c;预处理大型训练集&＃xff0c;或者你的深度学习批处理加载器中的处理逻辑过于繁重&＃xff0c;这会降低训练速度。

再强调一遍&＃xff1a;我同步发布了一个 Jupyter Notebook&＃xff0c;其中包含我在本文中讨论的例子。试试看&＃xff01;

Jupyter Notebook&＃xff1a;github.com/huggingface…

加速第一步&＃xff1a;剖析

首先要知道的是&＃xff0c;你的大多数代码在纯 Python 环境中可能运行的不错&＃xff0c;但是如果你多用点心&＃xff0c;其中一些瓶颈函数可能让你的代码快上几个数量级。

因此&＃xff0c;你首先应该分析你的 Python 代码并找出瓶颈部分的位置。使用如下的 cProfile 是一种选择&＃xff1a;

import cProfileimport pstatsimport myslowmodulecProfile.run(&＃39;myslowmodule.run()&＃39;, &＃39;restats&＃39;)p &＃61; pstats.Stats(&＃39;restats&＃39;)p.sortstats(&＃39;cumulative&＃39;).printstats(30)

如果你使用神经网络&＃xff0c;你可能会发现瓶颈部分是几个循环&＃xff0c;并且涉及 Numpy 数组操作。

那么&＃xff0c;我们如何加速这些循环代码&＃xff1f;

在 Python 中使用一些 Cython 加速循环

让我们用一个简单的例子来分析这个问题。假设我们有一大堆矩形&＃xff0c;并将它们存储进一个 Python 对象列表&＃xff0c;例如 Rectangle 类的实例。我们的模块的主要工作是迭代这个列表&＃xff0c;以便计算有多少矩形的面积大于特定的阈值。

我们的 Python 模块非常简单&＃xff0c;如下所示&＃xff1a;

from random import randomclass Rectangle:def __init__(self, w, h):self.w &＃61; wself.h &＃61; hdef area(self):return self.w * self.hdef check_rectangles(rectangles, threshold):n_out &＃61; 0for rectangle in rectangles:if rectangle.area() > threshold:n_out &＃43;&＃61; 1return n_outdef main():n_rectangles &＃61; 10000000rectangles &＃61; list(Rectangle(random(), random()) for i in range(n_rectangles))n_out &＃61; check_rectangles(rectangles, threshold&＃61;0.25)print(n_out)

check_rectangles 函数是瓶颈部分&＃xff01;它对大量的 Python 对象进行循环&＃xff0c;这可能会很慢&＃xff0c;因为 Python 解释器在每次迭代时都会做大量工作&＃xff08;寻找类中的求面积方法、打包和解包参数、调用 Python API ...&＃xff09;。

Cython 将帮助我们加速循环。

Cython 语言是 Python 的超集&＃xff0c;它包含两种对象&＃xff1a;

Python 对象是我们在常规 Python 中操作的对象&＃xff0c;如数字、字符串、列表、类实例...
Cython C 对象是 C 或 C &＃43;&＃43; 对象&＃xff0c;比如 double、int、float、struct、vectors。这些可以由 Cython 在超快速的底层代码中编译。

快速循环只是 Cython 程序&＃xff08;只能访问 Cython C 对象&＃xff09;中的一个循环。

设计这样一个循环的直接方法是定义 C 结构&＃xff0c;它将包含我们在计算过程中需要的所有要素&＃xff1a;在我们的例子中&＃xff0c;就是矩形的长度和宽度。

然后&＃xff0c;我们可以将矩形列表存储在这种结构的 C 数组中&＃xff0c;并将这个数组传递给我们的 check_rectangle 函数。此函数现在接受一个 C 数组作为输入&＃xff0c;因此通过 cdef 关键字而不是 def 将其定义为 Cython 函数&＃xff08;请注意&＃xff0c;cdef 也用于定义 Cython C 对象&＃xff09;。

下面是我们的 Python 模块的快速 Cython 版&＃xff1a;

from cymem.cymem cimport Pool from random import randomcdef struct Rectangle:float wfloat hcdef int check_rectangles(Rectangle* rectangles, int n_rectangles, float threshold):cdef int n_out &＃61; 0# C arrays contain no size information &＃61;> we need to give it explicitlyfor rectangle in rectangles[:n_rectangles]:if rectangles[i].w * rectangles[i].h > threshold:n_out &＃43;&＃61; 1return n_outdef main():cdef:int n_rectangles &＃61; 10000000float threshold &＃61; 0.25Pool mem &＃61; Pool()Rectangle* rectangles &＃61; mem.alloc(n_rectangles, sizeof(Rectangle))for i in range(n_rectangles):rectangles[i].w &＃61; random()rectangles[i].h &＃61; random()n_out &＃61; check_rectangles(rectangles, n_rectangles, threshold)print(n_out)

我们在这里使用了原生 C 指针数组&＃xff0c;但你也可以选择其他选项&＃xff0c;特别是 C &＃43;&＃43; 结构&＃xff0c;如向量、对、队列等。在这个片段中&＃xff0c;我还使用了 cymem 的便利的 Pool&＃xff08;&＃xff09;内存管理对象&＃xff0c;以避免必须手动释放分配的 C 数组。当 Pool 由 Python 当做垃圾回收时&＃xff0c;它会自动释放我们使用它分配的内存。

spaCy API 的 Cython Conventions 是 Cython 在 NLP 中的实际运用的一个很好的参考。

spaCy&＃xff1a;spacy.io

Cython Conventions&＃xff1a;spacy.io/api/cython#…

让我们试试这个代码吧&＃xff01;

有很多方法可以测试、编译和发布 Cython 代码&＃xff01;Cython 甚至可以直接用在 Python 这样的 Jupyter Notebook 中。

Jupyter Notebook&＃xff1a;cython.readthedocs.io/en/latest/s…

首先使用 pip install cython 安装 Cython

在 Jupyter 的第一次测试

使用 &＃xff05;load_ext Cython 将 Cython 插件加载到 Jupyter notebook 中。

现在&＃xff0c;你可以使用黑魔术命令 %% cython 编写像 Python 代码一样的 Cython 代码。

如果在执行 Cython 单元时遇到编译错误&＃xff0c;请务必检查 Jupyter 终端输出以查看完整的信息。

大多数情况下&＃xff0c;在 %% cython 编译为 C &＃43;&＃43;&＃xff08;例如&＃xff0c;如果你使用 spaCy Cython API&＃xff09;或者 import numpy&＃xff08;如果编译器不支持 NumPy&＃xff09;之后&＃xff0c;你会丢失 - &＃43; 标记。

正如我在开始时提到的&＃xff0c;查看这篇文章的同步 Jupyter Notebook&＃xff0c;该 Notebook 包含本文讨论的所有示例。

编写、使用和发布 Cython 代码

Cython 代码写在 .pyx 文件中。这些文件由 Cython 编译器编译为 C 或 C &＃43;&＃43; 文件&＃xff0c;然后通过系统的 C 编译器编译为字节码文件。Python 解释器可以使用字节码文件。

你可以使用 pyximport 直接在 Python 中加载 .pyx 文件&＃xff1a;

>>> import pyximport; pyximport.install() >>> import my_cython_module

你还可以将你的 Cython 代码构建为 Python 包&＃xff0c;并将其作为常规 Python 包导入/发布&＃xff0c;详见下方地址。这可能需要一些时间才能开始工作&＃xff0c;尤其在全平台上。如果你需要一个有效示例&＃xff0c;spaCy』s install script 是一个相当全面的例子。

导入教程&＃xff1a;cython.readthedocs.io/en/latest/s…

Before we move to some NLP, let』s quickly talk about the def, cdef and cpdef keywords, because they are the main things you need to grab to start using Cython.

在我们转向 NLP 之前&＃xff0c;让我们先快速讨论一下 def、cdef 和 cpdef 关键字&＃xff0c;因为它们是你开始使用 Cython 需要掌握的主要内容。

你可以在 Cython 程序中使用三种类型的函数&＃xff1a;

Python 函数&＃xff0c;用常用的关键字 def 定义。它们可作为输入和输出的 Python 对象。也可以在内部同时使用 Python 和 C / C &＃43;&＃43; 对象&＃xff0c;并可以调用 Cython 和 Python 函数。
用 cdef 关键字定义的 Cython 函数。它们可以作为输入&＃xff0c;在内部使用并输出 Python 和 C / C &＃43;&＃43;对象。这些函数不能从 Python 空间访问&＃xff08;即 Python 解释器和其他可导入 Cython 模块的纯 Python 模块&＃xff09;&＃xff0c;但可以由其他 Cython 模块导入。
用 cpdef 关键字定义的 Cython 函数就像 cdef 定义的 Cython 函数一样&＃xff0c;但它们也提供了一个 Python 封装器&＃xff0c;因此可以从 Python 空间&＃xff08;以 Python 对象作为输入和输出&＃xff09;以及其他 Cython 模块&＃xff08;以 C / C &＃43;&＃43; 或 Python 对象作为输入&＃xff09;中调用它们。

cdef 关键字有另一种用途&＃xff0c;即在代码中定义 Cython C / C &＃43;&＃43; 对象。除非用这个关键字定义对象&＃xff0c;否则它们将被视为 Python 对象&＃xff08;因此访问速度很慢&＃xff09;。

使用 Cython 与 spaCy 来加速 NLP

这些东西又好又快&＃xff0c;但是...... 我们现在还没有融入 NLP&＃xff01;没有字符串操作、没有 unicode 编码&＃xff0c;也没有我们在自然语言处理中幸运拥有的微妙联系。

官方的 Cython 文档甚至建议不要使用 C 字符串&＃xff1a;

一般来说&＃xff1a;除非你知道自己在做什么&＃xff0c;否则应尽可能避免使用 C 字符串&＃xff0c;而应使用 Python 字符串对象。

那么我们如何在使用字符串时在 Cython 中设计快速循环&＃xff1f;

spaCy 会帮我们的。

spaCy 解决这个问题的方式非常聪明。

将所有字符串转换为 64 位哈希码

spaCy 中的所有 unicode 字符串&＃xff08;token 的文本、其小写文本、引理形式、POS 键标签、解析树依赖关系标签、命名实体标签...&＃xff09;都存储在叫 StringStore 的单数据结构中&＃xff0c;它们在里面由 64 位散列索引&＃xff0c;即 C uint64_t。

StringStore 对象实现了 Python unicode 字符串和 64 位哈希码之间的查找表。

它可以通过 spaCy 任意处及任意对象访问&＃xff08;请参阅上图&＃xff09;&＃xff0c;例如 nlp.vocab.strings、doc.vocab.strings 或 span.doc.vocab.string。

当某个模块需要对某些 token 执行快速处理时&＃xff0c;仅使用 C 级别的 64 位哈希码而不是字符串。调用 StringStore 查找表将返回与哈希码相关联的 Python unicode 字符串。

但是&＃xff0c;spaCy 做的远不止这些&＃xff0c;它使我们能够访问文档和词汇表的完全覆盖的 C 结构&＃xff0c;我们可以在 Cython 循环中使用这些结构&＃xff0c;而不必自定义结构。

spaCy 的内部数据结构

与 spaCy Doc 对象关联的主要数据结构是 Doc 对象&＃xff0c;该对象拥有已处理字符串的 token 序列&＃xff08;「单词」&＃xff09;以及 C 对象中的所有称为 doc.c 的标注&＃xff0c;它是一个 TokenC 结构数组。

TokenC 结构包含我们需要的关于每个 token 的所有信息。这些信息以 64 位哈希码的形式存储&＃xff0c;可以重新关联到 unicode 字符串&＃xff0c;就像我们刚刚看到的那样。

要深入了解这些 C 结构中的内容&＃xff0c;只需查看刚创建的 SpaCy 的 Cython API doc。

我们来看看一个简单的 NLP 处理示例。

使用 spaCy 和 Cython 进行快速 NLP 处理

假设我们有一个需要分析的文本数据集

import urllib.request import spacywith urllib.request.urlopen(&＃39;https://raw.githubusercontent.com/pytorch/examples/master/word_language_model/data/wikitext-2/valid.txt&＃39;) as response: text &＃61; response.read() nlp &＃61; spacy.load(&＃39;en&＃39;) doc_list &＃61; list(nlp(text[:800000].decode(&＃39;utf8&＃39;)) for i in range(10))

我在左边写了一个脚本&＃xff0c;它生成用于 spaCy 解析的 10 份文档的列表&＃xff0c;每个文档大约 170k 字。我们也可以生成每个文档 10 个单词的 170k 份文档&＃xff08;比如对话数据集&＃xff09;&＃xff0c;但创建速度较慢&＃xff0c;因此我们坚持使用 10 份文档。

我们想要在这个数据集上执行一些 NLP 任务。例如&＃xff0c;我们想要统计数据集中单词「run」作为名词的次数&＃xff08;即用 spaCy 标记为「NN」词性&＃xff09;。

一个简单明了的 Python 循环就可以做到&＃xff1a;

def slow_loop(doc_list, word, tag):n_out &＃61; 0for doc in doc_list:for tok in doc:if tok.lower_ &＃61;&＃61; word and tok.tag_ &＃61;&＃61; tag:n_out &＃43;&＃61; 1return n_outdef main_nlp_slow(doc_list):n_out &＃61; slow_loop(doc_list, &＃39;run&＃39;, &＃39;NN&＃39;)print(n_out)

但它也很慢&＃xff01;在我的笔记本电脑上&＃xff0c;这段代码需要大约 1.4 秒才能得到结果。如果我们有一百万份文件&＃xff0c;则需要一天以上才能给出结果。

我们可以使用多线程&＃xff0c;但在 Python 中通常不是很好的解决方案&＃xff0c;因为你必须处理 GIL。另外&＃xff0c;请注意&＃xff0c;Cython 也可以使用多线程&＃xff01;而且这实际上可能是 Cython 最棒的部分&＃xff0c;因为 GIL 被释放&＃xff0c;我们可以全速运行。Cython 基本上直接调用 OpenMP。

现在我们尝试使用 spaCy 和部分 Cython 加速我们的 Python 代码。

首先&＃xff0c;我们必须考虑数据结构。我们将需要一个 C 数组用于数据集&＃xff0c;指针指向每个文档的 TokenC 数组。我们还需要将我们使用的测试字符串&＃xff08;「run」和「NN」&＃xff09;转换为 64 位哈希码。

当我们所需的数据都在 C 对象中时&＃xff0c;我们可以在数据集上以 C 的速度进行迭代。

下面是如何使用 spaCy 在 Cython 中编写的示例&＃xff1a;

%%cython -&＃43; import numpy # Sometime we have a fail to import numpy compilation error if we don&＃39;t import numpy from cymem.cymem cimport Pool from spacy.tokens.doc cimport Doc from spacy.typedefs cimport hash_t from spacy.structs cimport TokenCcdef struct DocElement:TokenC* cint lengthcdef int fast_loop(DocElement* docs, int n_docs, hash_t word, hash_t tag):cdef int n_out &＃61; 0for doc in docs[:n_docs]:for c in doc.c[:doc.length]:if c.lex.lower &＃61;&＃61; word and c.tag &＃61;&＃61; tag:n_out &＃43;&＃61; 1return n_outdef main_nlp_fast(doc_list):cdef int i, n_out, n_docs &＃61; len(doc_list)cdef Pool mem &＃61; Pool()cdef DocElement* docs &＃61; mem.alloc(n_docs, sizeof(DocElement))cdef Doc docfor i, doc in enumerate(doc_list): # Populate our database structuredocs[i].c &＃61; doc.cdocs[i].length &＃61; (doc).lengthword_hash &＃61; doc.vocab.strings.add(&＃39;run&＃39;)tag_hash &＃61; doc.vocab.strings.add(&＃39;NN&＃39;)n_out &＃61; fast_loop(docs, n_docs, word_hash, tag_hash)print(n_out)

代码有点长&＃xff0c;因为我们必须在调用 Cython 函数之前在 main_nlp_fast 中声明并填充 C 结构。&＃xff08;如果你在代码中多次使用低级结构&＃xff0c;使用 C 结构包装的 Cython 扩展类型来设计我们的 Python 代码是比每次填充 C 结构更优雅的选择。这就是大多数 spaCy 的结构&＃xff0c;它是一种结合了快速&＃xff0c;低内存以及与外部 Python 库和函数接口的简便性的非常优雅的方法。&＃xff09;

但它也快很多&＃xff01;在我的 Jupyter Notebook 中&＃xff0c;这个 Cython 代码的运行时间大约为 20 毫秒&＃xff0c;比我们的纯 Python 循环快大约 80 倍。

Jupyter Notebook cell 中编写的模块的绝对速度同样令人印象深刻&＃xff0c;并且可以为其他 Python 模块和函数提供本地接口&＃xff1a;在 30ms 内扫描约 1,700 万字意味着我们每秒处理高达 8000 万字。

我们这就结束了使用 Cython 进行 NLP 的快速介绍。我希望你喜欢它。

Cython 还有很多其他的东西可讲&＃xff0c;但这会让我们远离主题。从现在开始&＃xff0c;最好的地方可能就是 Cython tutorials 的概述和适用于 NLP 的 spaCy’s Cython page。

原文链接&＃xff1a;medium.com/huggingface…

推荐阅读

utf-8
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
case
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
blob
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
blob
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
require
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
数组
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
require
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
jsp
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
go
词根词缀解析：greg、hap、helio及其他词源故事

本文基于刘洪波老师的《英文词根词缀精讲》，深入探讨了多个重要词根词缀的起源及其相关词汇，帮助读者更好地理解和记忆英语单词。 ... [详细]

蜡笔小新 2024-12-27 18:59:50
grid
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
grid
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
go
如何在PHPCMS V9中实现多站点功能并配置独立域名与动态URL

本文介绍如何在PHPCMS V9中创建和管理多个站点，包括配置独立域名、设置动态URL，并确保各子站能够正常运行。我们将详细讲解从新建站点到最终配置路由的每一步骤。 ... [详细]

蜡笔小新 2024-12-27 05:15:58
go
解读MySQL查询执行计划的详细指南

本文旨在帮助开发者和数据库管理员深入了解如何解读MySQL查询执行计划。通过详细的解析，您将掌握优化查询性能的关键技巧，了解各种访问类型和额外信息的含义。 ... [详细]

蜡笔小新 2024-12-26 20:10:30
case
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
go
Weight the Tree（树形dp）

题目Link题目学习link1题目学习link2题目学习link3%%%受益匪浅！－－－－－&# ... [详细]

蜡笔小新 2024-12-26 15:55:56

我的双宝宝_486

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章