作者:王言 | 来源:互联网 | 2022-12-25 10:42
我试图理解Java的Object的hashCode(),并看到Java Object的hashCode()方法的以下代码:
package java.lang;
public class Object {
// Some more code
public native int hashCode();
// Some other code
}
现在,我们知道如果我们创建一个类,它会隐式扩展Object类,为此,我编写了一个示例示例:
package com.example.entity;
public class FirstClass {
private int id;
private String name;
// getters and setters
}
所以,这个类即:隐式FirstClass
扩展Object
类.
主要课程:
package com.example.app.main;
import com.example.entity.FirstClass;
public class MainApp {
public static void main(String[] args) {
FirstClass fs = new FirstClass();
fs.setId(1);
fs.setName("TEST");
System.out.println("The hasCode for object fs is " + fs.hashCode());
}
}
正如隐式FirstClass
扩展Object
类一样,因此它将具有Object
类的hashCode()
方法.
我调用了hashCode()
on FirstClass
对象,因为我没有覆盖它hashCode()
,理论上它应该调用Object
类hashCode()
.
我的疑问是:
由于Object类没有任何实现,如何计算任何对象的哈希码?
在我的例子中,当我运行程序时,它返回的哈希码是366712642.
任何人都可以帮我理解这个吗?
1> Eugene..:
虽然这里有一些答案表明默认实现是基于"内存"的,但这是完全错误的.现在很多年情况并非如此.
在java-8下,你可以这样做:
java -XX:+PrintFlagsFinal | grep hashCode
获取使用的确切算法(5
默认).
0 == Lehmer random number generator,
1 == "somehow" based on memory address
2 == always 1
3 == increment counter
4 == memory based again ("somehow")
5 == read below
默认情况下(5
),它使用的是Marsaglia XOR-Shift算法,它与内存无关.
如果您这样做,这不是很难证明:
System.out.println(new Object().hashCode());
多次,在一个新的VM中 - 你将获得相同的值,因此Marsaglia XOR-Shift以种子开始(总是相同,除非其他一些代码不会改变它)并从中开始工作.
但即使你切换到一些基于内存的hashCode,而Objects可能会四处移动(Garbage Collector调用),你如何确保在 GC移动这个对象后采取相同的hashCode ?提示:indentityHashCode和Object标头.
@CuriousMind哦那一个.它只打印JVM具有的所有标志及其默认值...
永远不会停止学习.将看到我可以做些什么来更新我的答案更准确.
2> GhostCat say..:
您弄错了:
public native int hashCode();
并不意味着没有实现。这仅表示该方法是在JVM 的本地 C / C ++部分中实现的。这意味着您找不到该方法的Java源代码。但是,每当您调用hashCode()
某个对象时,JVM内仍有一些代码会被调用。
正如另一个答案所解释的那样:“默认”实现使用了基础对象的“内存”地址。事情是:使用java意味着没有“内存地址”的知识。请记住:JVM是用C / C ++编写的- 真正的内存管理发生在JVM的这些本机部分中。
换句话说:您不能编写Java代码来告诉您对象的“本机内存地址”。
但是正如Eugene的另一个答案所表明的那样:关于“内存位置”的散列已经成为过去。
@Eugene`Object.hashCode` * still *的规范提到了对象的地址,这会引起误解。我已提交[JDK-8199394](https://bugs.openjdk.java.net/browse/JDK-8199394)来解决此问题。
@Eugene这里有两个方面。由于对象的内存地址可以在垃圾回收器移动它们时更改,因此一旦查询后,它们必须以某种方式记住其报告的哈希码。但是,问题是,如果仍然可以访问对象,则在线程的TLAB(即相同的内存区域)中创建对象,然后再将其移动到幸存者空间。因此,使用基于内存的哈希码将承担具有非常接近的值的风险(哈希分布不佳)。