Java中的大量Object(使用HashMap)

作者：承志68694849 | 来源：互联网 | 2023-05-17 08:05

如何解决《Java中的大量Object(使用HashMap)》经验，为你挑选了1个好方法。

你好,

我目前正在研究Java中的单词预测.为此,我使用的是基于NGram的模型,但我有一些内存问题......

在第一次,我有一个这样的模型:

public class NGram implements Serializable {
    private static final long serialVersiOnUID= 1L;

    private transient int count;
    private int id;
    private NGram next;

    public NGram(int idP) {
        this.id = idP;
    }
}



但这需要大量的记忆,所以我认为我需要优化,我想,如果我有"向世界问好"和"向人民问好",而不是得到两个ngram,我可以保留一个"你好" "然后有两个可能性:"人"和"世界".

更清楚的是,这是我的新模型:

public class BNGram implements Serializable {
    private static final long serialVersiOnUID= 1L;
    private int id;
    private HashMap next;
    private int count = 1;

    public BNGram(int idP) {
        this.id = idP;
        this.next = new HashMap();
    }
}


但似乎我的第二个模型消耗了两倍的内存...我认为这是因为HashMap,但我不知道如何减少这个？我尝试使用不同的Map实现,比如Trove或其他,但它不会改变任何东西.

为了给你一个想法,对于一个9MB的文本,带有57818个不同的单词(不同,但不是单词的总数),在NGram生成之后,我的javaw进程消耗1.2GB的内存...如果我用GZIPOutputStream保存它,磁盘上需要大约18MB.

所以我的问题是:如何使用更少的内存？我可以用压缩制作东西(作为序列化).我需要将其添加到其他应用程序,所以我需要减少内存使用量之前......

非常感谢,抱歉我的英语不好......

ZiMath


1> Federico Per..：
你需要一个专门的结构来实现你想要的.

看看Apache的PatriciaTrie.它就像一个Map,但它是记忆方面的,并与Strings一起使用.这也是非常快:操作是O(k),与k是最大的关键位的数量.

它有一个适合您眼前需要的操作:prefixMap()它返回SortedMap包含Strings 的trie视图,该视图以给定键为前缀.

一个简短的用法示例:

public class Patricia {

    public static void main(String[] args) {

        PatriciaTrie trie = new PatriciaTrie<>();

        String world = "hello the world";
        String people = "hello the people";

        trie.put(world, null);
        trie.put(people, null);

        SortedMap map1 = trie.prefixMap("hello");
        System.out.println(map1.keySet());  // [hello the people, hello the world]

        SortedMap map2 = trie.prefixMap("hello the w");
        System.out.println(map2.keySet()); // [hello the world]

        SortedMap map3 = trie.prefixMap("hello the p");
        System.out.println(map3.keySet());  // [hello the people]
    }
}


还有测试,其中包含更多示例.




    
        
                        java
                        hashmap
                        object
                        hash
                        static
                        final
                        version
                        int
                        gzip
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        hash
                        关于LinkedHashMap实现LRU缓存算法
                    

                    
                                                
                        缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-09-10 10:48:58
                    

                

                
                                
                    
                        version
                        阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient：4. 设备上报属性
                    

                    
                                                
                        阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 12:40:20
                    

                

                                
                    
                    
                
                
                                
                    
                        version
                        Java学习笔记之面向对象编程（OOP）
                    

                    
                                                
                            
                        
                                                
                        本文介绍了Java学习笔记中的面向对象编程（OOP）内容，包括OOP的三大特性（封装、继承、多态）和五大原则（单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则）。通过学习OOP，可以提高代码复用性、拓展性和安全性。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 08:44:30
                    

                

                
                                
                    
                        io
                        解决.net项目中未注册“microsoft.ACE.oledb.12.0”提供程序的方法
                    

                    
                                                
                            
                        
                                                
                        在开发.net项目中，通过microsoft.ACE.oledb读取excel文件信息时，报错“未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序”。本文提供了解决这个问题的方法，包括错误描述和代码示例。通过注册提供程序和修改连接字符串，可以成功读取excel文件信息。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 15:08:02
                    

                

                
                                
                    
                        hash
                        java-HashMap默认机制
                    

                    
                                                
                        HashMap:键值对（key-value）:通过对象来对对象进行索引，用来索引的对象叫做key,其对应的对象叫做value.默认是1:1关系:存在则覆盖，当key已经存在，则利用新的va ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-10-10 14:29:36
                    

                

                
                                
                    
                        io
                        java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析
                    

                    
                                                
                        HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-09-14 08:45:47
                    

                

                
                                
                    
                        io
                        如何自行分析定位SAP BSP错误
                    

                    
                                                
                            
                        
                                                
                        The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 19:58:05
                    

                

                
                                
                    
                        case
                        如何在有序字符序列中插入新字符并保持有序
                    

                    
                                                
                        本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 11:16:33
                    

                

                
                                
                    
                        int
                        iOS数据库Sqlite的SQL语句分类和常见约束关键字
                    

                    
                                                
                        本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型，其中DDL语句用于定义、删除和修改数据表，关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外，还介绍了常见的数据库数据类型，包括integer、text和real。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 18:42:03
                    

                

                
                                
                    
                        int
                        Java中包装类的设计原因以及操作方法
                    

                    
                                                
                            
                        
                                                
                        本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中，除了对象类型，还有八大基本类型，为了将基本类型转换成对象，Java引入了包装类。文章通过介绍包装类的定义和实现，解答了为什么需要包装类的问题，并提供了简单易用的操作方法。通过本文的学习，读者可以更好地理解和应用Java中的包装类。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 15:48:10
                    

                

                
                                
                    
                        io
                        java boolean 大小_java boolean 大小
                    

                    
                                                
                        先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 13:36:56
                    

                

                
                                
                    
                        version
                        JDK源码学习之HashTable(附带面试题)的学习笔记
                    

                    
                                                
                            
                        
                                                
                        本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记，包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货，并附带了其他相关主题的学习笔记。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 13:05:17
                    

                

                
                                
                    
                        typescript
                        React项目中运用React技巧解决实际问题的总结
                    

                    
                                                
                            
                        
                                                
                        本文总结了在React项目中如何运用React技巧解决一些实际问题，包括取消请求和页面卸载的关联，利用useEffect和AbortController等技术实现请求的取消。文章中的代码是简化后的例子，但思想是相通的。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-12 11:31:15
                    

                

                
                                
                    
                        io
                        Android系统源码分析Zygote和SystemServer启动过程详解
                    

                    
                                                
                            
                        
                                                
                        本文详细解析了Android系统源码中Zygote和SystemServer的启动过程。首先介绍了系统framework层启动的内容，帮助理解四大组件的启动和管理过程。接着介绍了AMS、PMS等系统服务的作用和调用方式。然后详细分析了Zygote的启动过程，解释了Zygote在Android启动过程中的决定作用。最后通过时序图展示了整个过程。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 17:46:46
                    

                

                
                                
                    
                        hash
                        Java中的Hashtable clear()方法详解
                    

                    
                                                
                        本文介绍了Java中Hashtable的clear()方法，该方法用于清除和移除指定Hashtable中的所有键。通过示例程序演示了clear()方法的使用。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 17:32:13

















    

    
        
            
            
                
                
            

            
                承志68694849            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    heatmap
                
                                
                    char
                
                                
                    iostream
                
                                
                    config
                
                                
                    java
                
                                
                    shell
                
                                
                    solr
                
                                
                    triggers
                
                                
                    client
                
                                
                    function
                
                                
                    php
                
                                
                    select
                
                                
                    hashset
                
                                
                    node.js
                
                                
                    format
                
                                
                    cmd
                
                                
                    typescript
                
                                
                    web
                
                                
                    int
                
                                
                    hash
                
                                
                    php7
                
                                
                    grid
                
                                
                    copy
                
                                
                    io
                
                                
                    case
                
                                
                    cSharp
                
                                
                    cPlusPlus
                
                                
                    loops
                
                                
                    version
                
                                
                    request
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1笔记本win7系统任务栏高度如何设置以及设置多少的方法(转载):怎样设置任务栏
                
                                
                    2DOM事件大全
                
                                
                    3如何在Python中对时间进行转换
                
                                
                    4网络安全主管难以维护公司安全
                
                                
                    5CAD如何调整中心线的线型比例？
                
                                
                    6-ubuntu
                
                                
                    7ShardingSphere学习笔记
                
                                
                    8MapReduce工作流程最详细解释
                
                                
                    9nodejs npm被自动删除？
                
                                
                    10线程安全解析（附带JVM内存结构和锁机制说明）
                
                                
                    11redis是干嘛的,springboot vue项目
                
                                
                    12flipflop和latch以及register的区别
                
                                
                    13win11亮度怎么调 win11亮度怎么调方法介绍
                
                                
                    14SVN安装配置和使用
                
                                
                    15SQL Server 2017 Express限制研究