最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.

作者：robioven | 来源：互联网 | 2023-08-09 20:59

WhyRedis 我们这个项目是对原有缓存系统的改进,应用场景是论坛发帖,回帖,置顶,以及操作日志等等;原有系统会有替换算法把内存缓存一部分冷数据逐渐从内存中换出,内存

Why Redis
我们这个项目是对原有缓存系统的改进,应用场景是论坛发帖,回帖,置顶,以及操作日志等等;原有系统会有替换算法把内存缓存一部分冷数据逐渐从内存中换出,内存对象序列化为XML文件持久化到磁盘;内存缓存一方面是为了访问速度,一方面是为后端的DB分担访问压力;而XML文件缓存则是为了避免雪崩,即当系统重启的时候由于缓存没有填充完毕,大量相同的请求会冲击到后端的DB;最初接手项目的时候，被告知公司老大要求xml 文件缓存必须保留，呵呵，通过和老大沟通其实保留文件缓存就是为了解决雪崩.

原有系统的问题在什么地方？
了解原有系统的瓶颈是第一步，原有系统主要问题是：

[1] 操作粒度过大,访问数加1这样的操作都会导致整个DataSet数据对象的序列化和反序列化

[2] 由于DataSet本身就是一个复杂数据结构,一方面会占用更多内存,一方面序列化和反序列化都会更比简单对象更耗时

[3] DataSet序列化XML,XML文件会有并发读写的问题,这里也是经常出现故障的点

这样我们就能整理出来设计的要点了:

[1]提供内存缓存的服务

[2]要有持久化缓存,系统重启之后,可以从持久化缓存加载到内存,避免雪崩

[3]要解决内存对象锁和文件锁的问题

[4]由于是从关系型DB读过来的数据,数据之间的关联关系是已经建立好的

新方案思考的起点是从数据操作粒度, 如果沿袭之前的方案,操作粒度是整个帖子+回帖+相关帖+操作日志的DataSet对象,对于只修改一两个字段的场景成本太高;所以决定把数据操作的粒度缩小,首先把DataSet中的业务对象拆开这是第一步,这也是我们最起码要做到的,拆分之后对象容器不再使用Dataset,我们把这种粒度称为粒度①;这样拆分之后,再一次缩小粒度,目标是把粒度控制为字段级别,这里的判断依据就是业务逻辑,比如操作日志每一次读写都是一个对象,那么把它的读写粒度放在字段级别没有多大好处;但是像主帖访问次数+1这种,就很适合字段级别的粒度,我们把这种粒度称为粒度②;Memcache可以很好的解决内存缓存的问题,但是存在的问题是:1.可以很容易做到支持粒度①,但是要做到粒度②需要构造维护对象的逻辑有点麻烦,与memcache交互的次数过多; 2.在这个基础上还必须要实现持久化缓存的部分.

如果是NoSql呢?经过对比Redis可以取代原来的内存缓存和XML文件缓存:

[1]可以作为内存缓存使用

[2]数据可以持久化

[3]支持多种数据结构,可以实现操作粒度②

学习Redis

我的Redis的学习参考主要集中在:

官方网站 http://redis.io/
Redis命令 http://redis.io/commands
Redis协议 http://redis.io/topics/protocol
NoSQLFan Redis资料汇总专题 http://blog.nosqlfan.com/html/3537.html

熟悉了命令之后,仔细阅读了Redis协议,总结在[Erlang 0019]Redis协议解读与实现(.Net & Erlang) ,通过协议的学习实际上有了一个心理底线:只要通过协议能够实现的功能,我们就可以在Client实现.NoSQLFan上汇集了很多优秀的Redis资料,我专门预留了一部分时间阅读上面的文章.

ServiceStack.Redis实践

Redis的C#客户端我选择的是ServiceStack.Redis,相比Booksleeve redis-sharp等方案,它提供了一整套从Redis数据结构都强类型对象转换的机制;看一个例子来了解一下ServiceStack.Redis是如何组织数据的,我们使用的实体类定义如下:

 public class User
    {
public User()
        {
this.BlogIds = new List<long>();
        }

public long Id { get; set; }
public string Name { get; set; }
public List<long> BlogIds { get; set; }
    }

使用下面的代码片段,我们存入两条数据到Redis:

    using (var redisUsers = redisClient.GetTypedClient())
            {
var ayende = new User { Id = redisUsers.GetNextSequence(), Name = "Oren Eini" };
var mythz = new User { Id = redisUsers.GetNextSequence(), Name = "Demis Bellot" };
                redisUsers.Store(ayende);
                redisUsers.Store(mythz);
              }

我们看下Redis中的结果:

redis 127.0.0.1:6379[1]> keys *
1) "seq:User"
2) "ids:User"
3) "urn:user:1"
4) "urn:user:2"

我们逐一检查一下数据类型:

seq:User	string	维护当前类型User的ID自增序列,用做对象唯一ID
ids:User	set	同一类型User所有对象ID的列表
urn:user:1	string	user对象

seq:User 维护的是类型User的ID序列 redisUsers.GetNextSequence()

public long GetNextSequence(int incrBy)
  {
return IncrementValueBy(SequenceKey, incrBy);
  }
public long IncrementValue(string key)
    {
return client.Incr(key);
     }

这里的SequenceKey就是 "seq:User",然后我们通过存一个对象到Redis看另外两个key是什么作用:

 public T Store(T entity)
        {
var urnKey = entity.CreateUrn();
this.SetEntry(urnKey, entity);

return entity;
        }
//entity.CreateUrn();的结果是"urn:user:1"
        public void SetEntry(string key, T value)
        {
if (key == null)
throw new ArgumentNullException("key");

            client.Set(key, SerializeValue(value));
            client.RegisterTypeId(value);
        }

internal void RegisterTypeId(T value)
        {
var typeIdsSetKey = GetTypeIdsSetKey();
var id = value.GetId().ToString();

if (this.Pipeline != null)
            {
var registeredTypeIdsWithinPipeline = GetRegisteredTypeIdsWithinPipeline(typeIdsSetKey);
                registeredTypeIdsWithinPipeline.Add(id);
            }
else
            {
this.AddItemToSet(typeIdsSetKey, id);
            }
        }

这里的typedIdsSetKey 就是"ids:User"

ids:User相当于一个索引,包含了所有同为类型User的ID;由于维护了这样一个分组信息,所以很容易实现GetAll()这样的功能;

在redis-cli中查询一下 get urn:user:1 返回值是JSON格式:

"{\"Id\":1,\"Name\":\"Oren Eini\",\"BlogIds\":[1]}"

ServiceStack.Redis 自己实现了一套序列化功能,Fastest JSON Serializer for .NET released 支持 POCO(Plain Old CLR Object)序列化.

实际应用中,由于我们使用的数据是来自关系型数据库,本身包含关联关系,所以并不需要这样的对象组织方式;我们只需要把关系型数据中一对多的关系在Redis中表达出来即可;这里我扩展修改了RedisClient的实现,由于RedisClient本身已经通过partial方式分割成若干个文件,所以很容易把变动的代码集中在同一个代码文件中.具体业务对象存储,主帖和回帖会有字段级修改,所以设计成为Hash结构,其它几个子对象读写都是以对象为单位,设计成为POCO方式持久化;

使用管道Pipeline遇到的问题

使用管道可以将客户端到Redis的往返次数减少,不过在使用ServiceStack.Redis的时候,遇到这样一个问题,比如要把一个List全部存储,代码不可以写成下面这样:

%%第一种写法 
           logs.ForEach(n =>
                {
                    pipeline.QueueCommand(r =>
                    {
                        ((RedisClient)r).Store(n, n.GetObjectID(), n.GetUrnKey());
                        ((RedisClient)r).Expire(n.GetUrnKey(), dataLifeTime);
                    });
                });

而是要写成这样:

%%第二种写法
 logs.ForEach(n =>
                {

                    pipeline.QueueCommand(r => ((RedisClient)r).Store(n, n.ID, n.GetUrnKey()));
                    pipeline.QueueCommand(r => ((RedisClient)r).Expire(n.GetUrnKey(), dataLifeTime));

                });

什么原因呢?RedisQueueCompletableOperation的AddCurrentQueuedOperation方法会在执行CurrentQueuedOperation = null;如果按照第一种写法会丢失回调函数,这就造成有返回值在没有及时提取,后续的操作获取返回值时首先取到的是积压的结果信息,就出现了异常,而第二种写法就避免了这个问题.

  protected virtual void AddCurrentQueuedOperation()
        {
this.QueuedCommands.Add(CurrentQueuedOperation);
            CurrentQueuedOperation = null;
        }

Redis工具篇

Redis的客户端redis-cli不是太好用,退格键和箭头都不能正常使用,这个的确影响效率,还是需要找一个合适的工具,我比较喜欢这个:RedisConsole

https://github.com/ptrofimov/RedisConsole/downloads

这个工具用来学习是很好用的,但是数据量一旦增大,左侧列表就混乱了,而且一点击就假死;所以建议只在学习阶段使用;

最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.

在没有window的环境,启动一个Erlang的客户端也是一个不错的选择.

Web端的管理工具我选用的是 Redis Admin UI

这个ServiceStack.Redis的配套项目,修改一下web.config就能用,地址在此:http://www.servicestack.net/mythz_blog/?p=381

Redis图书资料:

[1] Big Data Glossary - O'Reilly Media

[2] The Little Redis Book by Karl Seguin

[3] Redis Cookbook (O'Reilly Media, 2011)

[4] Professional NoSQL (Wrox, 2011)

刚刚在NOSQLFan上看到一篇一定要转过来:

原文: http://blog.nosqlfan.com/html/3729.html

这两年Redis火得可以，Redis也常常被当作Memcached的挑战者被提到桌面上来。关于Redis与Memcached的比较更是比比皆是。然而，Redis真的在功能、性能以及内存使用效率上都超越了Memcached吗？

下面内容来自Redis作者在***上的一个回答，对应的问题是《Is memcached a dinosaur in comparison to Redis?》（相比Redis，Memcached真的过时了吗？）

You should not care too much about performances. Redis is faster per core with small values, but memcached is able to use multiple cores with a single executable and TCP port without help from the client. Also memcached is faster with big values in the order of 100k. Redis recently improved a lot about big values (unstable branch) but still memcached is faster in this use case. The point here is: nor one or the other will likely going to be your bottleneck for the query-per-second they can deliver.

没有必要过多的关心性能，因为二者的性能都已经足够高了。由于Redis只使用单核，而Memcached可以使用多核，所以在比较上，平均每一个核上Redis在存储小数据时比Memcached性能更高。而在100k以上的数据中，Memcached性能要高于Redis，虽然Redis最近也在存储大数据的性能上进行优化，但是比起Memcached，还是稍有逊色。说了这么多，结论是，无论你使用哪一个，每秒处理请求的次数都不会成为瓶颈。（比如瓶颈可能会在网卡）

You should care about memory usage. For simple key-value pairs memcached is more memory efficient. If you use Redis hashes, Redis is more memory efficient. Depends on the use case.

如果要说内存使用效率，使用简单的key-value存储的话，Memcached的内存利用率更高，而如果Redis采用hash结构来做key-value存储，由于其组合式的压缩，其内存利用率会高于Memcached。当然，这和你的应用场景和数据特性有关。

You should care about persistence and replication, two features only available in Redis. Even if your goal is to build a cache it helps that after an upgrade or a reboot your data are still there.

如果你对数据持久化和数据同步有所要求，那么推荐你选择Redis，因为这两个特性Memcached都不具备。即使你只是希望在升级或者重启系统后缓存数据不会丢失，选择Redis也是明智的。

You should care about the kind of operations you need. In Redis there are a lot of complex operations, even just considering the caching use case, you often can do a lot more in a single operation, without requiring data to be processed client side (a lot of I/O is sometimes needed). This operations are often as fast as plain GET and SET. So if you don’t need just GEt/SET but more complex things Redis can help a lot (think at timeline caching).

当然，最后还得说到你的具体应用需求。Redis相比Memcached来说，拥有更多的数据结构和并支持更丰富的数据操作，通常在Memcached里，你需要将数据拿到客户端来进行类似的修改再set回去。这大大增加了网络IO的次数和数据体积。在Redis中，这些复杂的操作通常和一般的GET/SET一样高效。所以，如果你需要缓存能够支持更复杂的结构和操作，那么Redis会是不错的选择。

推荐阅读

int
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
text
开发中遇到的一些常见问题及解决方案

本文总结了一些开发中常见的问题及其解决方案，包括特性过滤器的使用、NuGet程序集版本冲突、线程存储、溢出检查、ThreadPool的最大线程数设置、Redis使用中的问题以及Task.Result和Task.GetAwaiter().GetResult()的区别。 ... [详细]

蜡笔小新 2024-11-12 08:20:05
text
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
case
使用Shell脚本高效部署MHA高可用集群

本文介绍了如何利用Shell脚本高效地部署MHA（MySQL High Availability）高可用集群。通过详细的脚本编写和配置示例，展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程，还提高了系统的稳定性和可用性。 ... [详细]

蜡笔小新 2024-11-10 10:15:46
text
Bootstrap 学习指南：全面掌握前端框架的核心知识点与实战技巧

### 优化后的摘要本学习指南旨在帮助读者全面掌握 Bootstrap 前端框架的核心知识点与实战技巧。内容涵盖基础入门、核心功能和高级应用。第一章通过一个简单的“Hello World”示例，介绍 Bootstrap 的基本用法和快速上手方法。第二章深入探讨 Bootstrap 与 JSP 集成的细节，揭示两者结合的优势和应用场景。第三章则进一步讲解 Bootstrap 的高级特性，如响应式设计和组件定制，为开发者提供全方位的技术支持。 ... [详细]

蜡笔小新 2024-11-09 16:58:21
web
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
instance
求助：如何使用Pull方法解析标签内容，悬赏50分求完美解决方案

在处理 XML 数据时，如果需要解析 `` 标签的内容，可以采用 Pull 解析方法。Pull 解析是一种高效的 XML 解析方式，适用于流式数据处理。具体实现中，可以通过 Java 的 `XmlPullParser` 或其他类似的库来逐步读取和解析 XML 文档中的 `` 元素。这样不仅能够提高解析效率，还能减少内存占用。本文将详细介绍如何使用 Pull 解析方法来提取 `` 标签的内容，并提供一个示例代码，帮助开发者快速解决问题。 ... [详细]

蜡笔小新 2024-11-09 11:50:14
spring
2021年Java开发实战：当前时间戳转换方法详解与实用网址推荐

在当前的就业市场中，金九银十过后，金三银四也即将到来。本文将分享一些实用的面试技巧和题目，特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验，并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法，并推荐了一些实用的在线资源，帮助读者更好地应对技术面试。 ... [详细]

蜡笔小新 2024-11-08 22:43:32
text
深入解析C#中app.config文件的配置与修改方法

在C#开发过程中，经常需要对系统的配置文件进行读写操作，如系统初始化参数的修改或运行时参数的更新。本文将详细介绍如何在C#中正确配置和修改app.config文件，包括其结构、常见用法以及最佳实践。此外，还将探讨exe.config文件的生成机制及其在不同环境下的应用，帮助开发者更好地管理和维护应用程序的配置信息。 ... [详细]

蜡笔小新 2024-11-08 09:49:44
buffer
如何在CICS服务器端识别非客户端模式的用户连接并解决信息获取错误问题

在CICS应用环境中，众多客户端通过网络与CICS服务器进行连接。系统管理员可以通过CICS系统交易CEMT查询当前连接的客户端信息。然而，在非客户端模式下，识别用户连接并解决信息获取错误的问题变得更为复杂。本文将探讨如何在CICS服务器端准确识别非客户端模式的用户连接，并提供有效的解决方案，以确保系统的稳定性和数据的准确性。此外，还将介绍一些常用的诊断工具和技术，帮助管理员快速定位和解决问题。 ... [详细]

蜡笔小新 2024-11-07 20:01:19
text
Presto：高效即席查询引擎的深度解析与应用

本文深入解析了Presto这一高效的即席查询引擎，详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式，显著提升了查询性能，相比传统的MapReduce查询，不仅减少了数据传输的延迟，还提高了查询的准确性和效率。然而，Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景，展示了其在大数据分析领域的强大潜力。 ... [详细]

蜡笔小新 2024-11-07 19:17:47
int
Python 数据库操作指南：MySQL 与 Redis 实战技巧

本文详细介绍了使用 Python 进行 MySQL 和 Redis 数据库操作的实战技巧。首先，针对 MySQL 数据库，通过 `pymysql` 模块展示了如何连接和操作数据库，包括建立连接、执行查询和更新等常见操作。接着，文章深入探讨了 Redis 的基本命令和高级功能，如键值存储、列表操作和事务处理。此外，还提供了多个实际案例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-07 12:55:01
web
音视频服务Java Web服务器部署详解与验证流程

本文详细介绍了如何在Java Web服务器上部署音视频服务，并提供了完整的验证流程。以AnyChat为例，这是一款跨平台的音视频解决方案，广泛应用于需要实时音视频交互的项目中。通过具体的部署步骤和测试方法，确保了音视频服务的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-06 14:45:13
int
Java并发编程指南：深入理解信号量机制

本文是Java并发编程系列的开篇之作，将详细解析Java 1.5及以上版本中提供的并发工具。文章假设读者已经具备同步和易失性关键字的基本知识，重点介绍信号量机制的内部工作原理及其在实际开发中的应用。 ... [详细]

蜡笔小新 2024-11-11 15:49:02
int
性能测试中的关键监控指标与深入分析

在软件性能测试中，关键监控指标的选取至关重要。主要目的包括：1. 评估系统的当前性能，确保其符合预期的性能标准；2. 发现软件性能瓶颈，定位潜在问题；3. 优化系统性能，提高用户体验。通过综合分析这些指标，可以全面了解系统的运行状态，为后续的性能改进提供科学依据。 ... [详细]

蜡笔小新 2024-11-11 01:42:16

robioven

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章