MongoDB、Java和ORM

作者：LEE渡 | 来源：互联网 | 2014-05-28 16:53

MongoDB简介目前有很多互相竞争的NoSQL产品，它们使用的方式不尽相同，但都能很好地解决大数据问题。MongoDB就是其中一款非常不错的产品。MongoDB是面向文档、无Schema的存储解决方案，它用JSON风格的文档展现、查询、修改数据。MongoDB有很丰富的文档，安

MongoDB简介

目前有很多互相竞争的NoSQL产品，它们使用的方式不尽相同，但都能很好地解决大数据问题。MongoDB就是其中一款非常不错的产品。MongoDB是面向文档、无Schema的存储解决方案，它用JSON风格的文档展现、查询、修改数据。

MongoDB有很丰富的文档，安装和设置都很简单，而且易于扩展。它支持大家熟知的复制、分片、索引和Map/Reduce等概念。MongoDB开源社区的规模很大，也很活跃。让MongoDB引以为豪的是，包括Disney、Craigslist、Foursquare、Github和SourceForge在内的大型、高流量生产环境都已经部署了MongoDB。MongoDB是个开源项目，由DoubleClick前高管们创办的10gen.com公司创建和维护。除了很积极地参与社区支持外，10gen也提供商业支持。

MongoDB和NoSQL的优劣势

作为NoSQL解决方案，MongoDB的优势是很容易上手。在我第一次深入研究NoSQL数据库的时候，尝试了很多基于Java的解决方案，我发现要搞清楚什么是列族（column family）、Hadoop和HBase之间是什么关系、ZooKeeper到底是什么非常费时间。我最终想明白这些问题的时候，才明白Cassandra、HBase等产品都是非常完善的NoSQL解决方案。和其他解决方案相比，MongoDB则更容易掌握一些，开始写代码之前不需要理解太多的概念。

很显然，MongoDB和任何软件一样都存在缺陷。在学习、使用MongoDB的过程中，我遇到过几件可算是“陷阱”的事情：

不要把它用成RDBMS。这一点看起来显而易见，但在MongoDB里创建、执行复杂查询都很容易，以至于到了想用它做实时查询的时候，你可能才会发现自己已经做过头了，而且可能会碰到性能问题。（我以前就犯过这样的错）

MongoDB的索引是Binary Tree。如果你不太熟悉B-Tree，应该研究一下。查询条件的顺序要和创建索引的顺序相匹配。

精心设计索引。这和前面提到的B-Tree有关系。我刚开始创建的几个索引都包含文档里的很多字段，因为总是想着以后可能会查询它们，这种想法你应该能够理解。不要犯这样的错误。我曾给一个很小的集合（大约一千万条记录）创建了一个索引，这个索引后来增长到17GB，比集合本身还要大。如果某个数组字段可能会包含成百上千的条目，你可能不会给它创建索引。

MongoDB支持NoSQL的方法非常有趣，它用BSON存储、用JSON表示，管理和Map/Reduce则用了Javascript。这样一来，等MongoDB发展的时间足够久、和更流行的大数据解决方案一样长的时候，MongoDB必然会出现一些奇怪的小问题，比如在NumberLong上使用等于运算符会判断失败。

MongoDB、控制台、驱动程序

MongoDB的管理通常可以在一个Javascript客户端控制台应用上进行，控制台应用能简化数据迁移和操作等复杂任务；你也完全可以用Javascript语言编程实现MongoDB的管理。在这篇文章里，我们会示范控制台的使用。现在的MongoDB客户端产品非常多，它们都具备能投入生产环境的品质，MongoDB社区也称它们为驱动程序。一般来说，每种编程语言都有各自的驱动程序，这些驱动程序能覆盖所有流行的编程语言，还有一些并不是很流行的编程语言。本文将展示MongoDB的Java驱动程序该如何使用，也会和使用ORM库（MJORM）的方式进行比较。

MJORM简介：MongoDB的ORM解决方案

NoSQL数据存储还有很多有趣的问题需要解决，最近让应用程序员比较关心的是对象关系映射（ORM）。ORM是指持久化数据和应用所用对象之间的映射，持久化数据过去都存储在关系型数据库里。ORM能让处理数据的过程更加流畅、更加贴近编写应用的语言。

MongoDB面向文档的架构让它很容易进行ORM，因为它存储的文档本身就是对象。不过可惜的是，可用于MongoDB的Java ORM库还不是很多，目前只有morphia（针对MongoDB的Java库，是类型安全的）和spring-data（Spring Data综合项目的MongoDB实现）。

这些ORM库使用了大量注解，出于很多原因，我并不倾向于使用注解，其中最重要的是被注解的对象在多个项目之间的可移植性问题。所以我创建了mongo-Java-orm项目（MJORM，发音为me-yorm），它是针对MongoDB的Java ORM。MJORM使用MIT许可，放在了Google Code上。项目用Maven构建，Maven的工件库目前托管在Google Code的Subversion服务器上。写这篇文章的时候，MJORM最新的稳定发布版本是0.15，个别项目已经在生产环境里使用了。

MJORM入门 将MJORM库添加到项目里

Maven用户首先要将MJORM的Maven仓库添加到pom.xml文件里，以便自己的项目能使用MJORM工件：

    mjorm-webdav-maven-repo
    mjorm maven repository
    http://mongo-Java-orm.googlecode.com/svn/maven/repo/
    default

然后添加依赖本身：

    com.googlecode
    mongo-Java-orm
    0.15

这样你就能把MJORM类导入到自己的应用里并使用它们。如果你没用Maven，那你需要手动下载MJORM库，还有MJORM pom.xml里列出的所有依赖。

创建POJO

依赖关系处理好之后，就开始编写代码吧。我们先编写Java POJO：

class Author {
    private String firstName;
    private String lastName;
    // ... setters and getters ...
}
class Book {
    private String id;
    private String isbn;
    private String title;
    private String description;
    private Author author;
    // ... setters and getters ...
}

上面的对象模型描述了作者和书，作者有一个ID、还有姓氏和名字，书的描述信息则包含ID、ISBN号、标题、描述信息和作者。

可以看到书的ID属性是一个String，它会适应成MongoDB的ObjectId类型，ObjectId类型是个十二字节的二进制值，用十六进制的字符串来表示。虽然MongoDB要求所有集合里的每个文档都要有一个唯一的ID，但并没有要求ID必须是ObjectId类型。目前MJORM支持的ID类型只有ObjectId，而且会把它们表示成String。

你可能已经注意到，Author对象没有ID。这是因为Author是Book文档的子文档，所以就没必要非得有一个ID了。请记住，MongoDB的ID只需要放在一个集合的根级别文档中。

创建XML映射文件

下一步是创建XML映射文件，MJORM会用这些映射文件把MongoDB文档映射成对象。在本文的演示里，我们会给两个对象各创建一个文档，但真正合理的做法是把所有的映射都放在一个XML文件里，或者根据实际需要进行分割。

下面是Author.mjorm.xml：

Book.mjorm.xml是：

映射文件完全能自解释。descriptors元素是根元素，所有的映射文件都要有。根元素下面是object元素，用来定义要被映射到MongoDB文档的类。object会包含property元素，用来描述POJO的所有属性，以及它们怎样映射到MongoDB文档的属性。property元素至少要有一个name属性，这是POJO属性的名称，也是MongoDB文档属性的名称。property元素还可以添加一个column属性，指定MongoDB文档里备用的属性名称。

包含id属性的property元素会被看作是对象的唯一标识符。一个object元素可以只包含一个带有id属性的property元素。auto属性是让MJORM在持久化这个属性时给它自动生成一个值。

要想了解有关XML映射文件更详细的说明，请移步至Google Code上的MJORM项目。

整合

我们现在已经创建好了数据模型，还有告诉MJORM在数据写入MongoDB时如何解析POJO、从MongoDB读取数据时如何封装POJO的映射文件，那我们就可以开始一段有趣的学习之旅了。首先我们必须打开到MongoDB的连接：

Mongo mongo = new Mongo(
new MongoURI("mongodb://localhost/mjormIsFun")); // 10gen驱动程序

Mongo对象来自10gen员工编写的Java驱动程序。这个例子打开了一个到本地MongoDB实例的连接，使用mjormIsFun数据库。接下来我们创建MJORM里的ObjectMapper。目前MJORM里可用的ObjectMapper接口实现只有XmlDescriptorObjectMapper，它使用前面的XML Schema，MJORM以后的实现可能会支持注解或其他配置机制。

XmlDescriptorObjectMapper objectMapper = new XmlDescriptorObjectMapper();
mapper.addXmlObjectDescriptor(new File("Book.mjorm.xml"));
mapper.addXmlObjectDescriptor(new File("Author.mjorm.xml"));

我们创建了XmlDescriptorObjectMapper对象，并添加了映射文件。下一步我们会创建一个MJORM提供的MongoDao对象实例：

DB db = mongo.getDB("mjormIsFun"); // 10gen驱动程序
MongoDao dao = new MongoDaoImpl(db, objectMapper);

我们先获取了一个10gen驱动程序里的DB对象实例。然后用DB对象和先前创建的ObjectMapper来创建MongoDao。现在已经做好了持久化数据的准备，那让我们创建一个Book对象，并把它保存到MongoDB里去。

Book book = new Book();
book.setIsbn("1594743061");
book.setTitle("MongoDB is fun");
book.setDescription("...");
book = dao.createObject("books", book);
System.out.println(book.getId()); // 4f96309f762dd76ece5a9595

我们先创建了Book对象，赋值之后调用了MongoDao的createObject方法，两个参数分别是集合名称“books”和Book对象。MJORM接着会用先前创建的XML映射文件把Book转换成DBObject（10gen的Java驱动程序所使用的基本对象类型），并把新的文档持久化到“books”集合中。然后MJORM会返回Book对象的实例，返回的Book对象实例带有生成的id属性。重点要注意的是，MongoDB在默认情况下并不会要求创建好数据库或集合后才能使用；MongoDB在需要的时候才会创建它们，这有时候会引起混乱。从MongoDB控制台上看到的新Book如下所示：

> db.books.find({_id:ObjectId("4f96309f762dd76ece5a9595")}).pretty()
{
    "_id":          ObjectId("4f96309f762dd76ece5a9595"),
    "isbn":         "1594743061",
    "title":        "MongoDB is fun",
    "description":  "..."
}

让我们来看看如果不使用MJORM，而是直接用10gen的Java驱动程序，createObject的过程是怎样的：

Book book = new Book();
book.setIsbn("1594743061");
book.setTitle("MongoDB is fun");
book.setDescription("...");
DBObject bookObj = BasicDBObjectBuilder.start()
    .add("isbn",                book.getIsbn())
    .add("title",               book.getTitle())
    .add("description", book.getDescription())
    .get();
// ‘db’是我们先前创建的DB对象
DBCollection col = db.getCollection("books");
col.insert(bookObj);
ObjectId id = ObjectId.class.cast(bookObj.get("_id"));
System.out.println(id.toStringMongod()); // 4f96309f762dd76ece5a9595

现在我们来查询一下对象：

Book book = dao.readObject("books", "4f96309f762dd76ece5a9595", Book.class);
System.out.println(book.getTitle()); // "MongoDB is fun"

readObject方法用指定的id从特定集合中读取文件，然后将文件转换成相应的类（会再次使用先前的映射文件）并返回。

敏锐的你可能已经察觉到我们的Book还没Author，但Book仍然被持久化了。这正是MongoDB的无Schema特性。除了id之外，我们不能要求集合里的文档包含任何属性，所以在MongoDB里创建没有Author的Book是完全没有问题的。让我们给Book添加一位Author并更新：

Author author = new Author();
author.setFirstName("Brian");
author.setLastName("Dilley");
book.setAuthor(author);
dao.updateObject("books", "4f96309f762dd76ece5a9595", book);

现在的Book包含了Author，也持久化到了MongoDB。让我们从MongoDB控制台上看看新的Book：

正如你所看到的，持久化的Book现在包含一个作者。接着再看看不使用MJORM的情况：

Author author = new Author();
author.setFirstName("Brian");
author.setLastName("Dilley");
book.setAuthor(author);
DBObject bookObj = BasicDBObjectBuilder.start()
    .add("isbn",                book.getIsbn())
    .add("title",               book.getTitle())
    .add("description", book.getDescription())
    .push("author")
        .add("firstName",       author.getFirstName())
        .add("lastName",        author.getLastName())
        .pop()
    .get();
DBCollection col = db.getCollection("books");
col.update(new BasicDBObject("_id", bookObj.get("_id")), bookObj);

在这篇文章里我们就不深入介绍MongoDao的所有方法了。如果你想在项目里使用MJORM，推荐你看看MJORM项目的文档，或者是MJORM项目提供的MongoDao接口。

推荐阅读

go
如何在U8系统中连接服务器并获取数据

本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据，包括使用MySQL客户端连接实例的方法，如非SSL连接和SSL连接，并提供了详细的步骤和注意事项。 ... [详细]

蜡笔小新 2024-11-19 12:08:19
js
实践指南：使用Express、Create React App与MongoDB搭建React开发环境

本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境，旨在为开发者提供一套完整的解决方案，包括环境搭建、数据模拟及前后端交互。 ... [详细]

蜡笔小新 2024-11-20 10:05:15
callback
Python3爬虫入门：pyspider的基本使用[python爬虫入门]

Python学习网有大量免费的Python入门教程，欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]

蜡笔小新 2024-11-22 18:00:41
random
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
version
Docker安全策略与管理

本文探讨了Docker的安全挑战、核心安全特性及其管理策略，旨在帮助读者深入理解Docker安全机制，并提供实用的安全管理建议。 ... [详细]

蜡笔小新 2024-11-21 20:03:03
config
调试利器SSH隧道

在开发微信公众号或小程序的时候，由于微信平台规则的限制，部分接口需要通过线上域名才能正常访问。但我们一般都会在本地开发，因为这能快速的看到 ... [详细]

蜡笔小新 2024-11-21 11:15:53
config
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
search
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
config
MongoDB 高可用集群搭建指南：分片、读写分离与负载均衡

本文详细介绍了如何搭建一个高可用的MongoDB集群，包括环境准备、用户配置、目录创建、MongoDB安装、配置文件设置、集群组件部署等步骤。特别关注分片、读写分离及负载均衡的实现。 ... [详细]

蜡笔小新 2024-11-20 18:28:16
object
深入解析：存储技术的演变与发展

本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程，详细解释了各种存储模型及其特点。 ... [详细]

蜡笔小新 2024-11-19 11:25:40
object
构建用户画像环境：Hive与SparkSQL的高效整合

本文介绍如何通过整合SparkSQL与Hive来构建高效的用户画像环境，提高数据处理速度和查询效率。 ... [详细]

蜡笔小新 2024-11-19 09:44:24
hash
Redis：缓存与内存数据库详解

本文介绍了数据库的基本分类，重点探讨了关系型与非关系型数据库的区别，并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]

蜡笔小新 2024-11-18 14:16:11
hash
大数据领域的职业路径与角色解析

本文将深入探讨大数据领域的各种职业和工作角色，帮助读者全面了解大数据行业的需求、市场趋势，以及从入门到高级专业人士的职业发展路径。文章还将详细介绍不同公司对大数据人才的需求，并解析各岗位的具体职责、所需技能和经验。 ... [详细]

蜡笔小新 2024-11-16 08:54:03
config
MongoDB核心概念详解

本文介绍了NoSQL数据库的概念及其应用场景，重点解析了MongoDB的基本特性、数据结构以及常用操作。MongoDB是一个高性能、高可用且易于扩展的文档数据库系统。 ... [详细]

蜡笔小新 2024-11-15 10:24:19
config
解决 Ubuntu 环境下 Hadoop 集群 SSH 密钥认证问题

本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文，读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录，从而顺利启动 Hadoop 集群。 ... [详细]

蜡笔小新 2024-11-13 09:14:02

LEE渡

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章