pandas.util.hash_array #

pandas.util。hash_array ( vals ,编码= 'utf8' , hash_key = '0123456789123456' , categorize = True ) [来源] #

给定一个一维数组,返回一个确定性整数数组。

参数
vals ndarray 或 ExtensionArray
编码str,默认'utf8'

字符串时数据和键的编码。

hash_key str,默认_default_hash_key

Hash_key 用于要编码的字符串键。

分类bool, 默认 True

是否在散列之前首先对对象数组进行分类。当数组包含重复值时,这会更有效。

返回
ndarray[np.uint64, ndim=1]

哈希值,与 val 的长度相同。

例子

>>> pd.util.hash_array(np.array([1, 2, 3]))
array([ 6238072747940578789, 15839785061582574730,  2185194620014831856],
  dtype=uint64)