3 回答
TA贡献1963条经验 获得超6个赞
数组是引用类型。所有引用类型都带有两个附加的单词字段。类型引用和SyncBlock索引字段,除其他外,这些字段用于实现CLR中的锁定。因此,引用类型的类型开销是32位上的8个字节。最重要的是,数组本身还存储了另外4个字节的长度。这使总开销达到12个字节。
我刚刚从乔恩·斯凯特(Jon Skeet)的答案中学到,引用类型的数组还有4个字节的额外开销。可以使用WinDbg确认。事实证明,附加字是存储在数组中的类型的另一个类型引用。所有引用类型的数组都在内部存储为object[],并附加了对实际类型的类型对象的引用。因此,a string[]实际上只是一个object[]带有对type的附加类型引用的a string。有关详细信息,请参见下文。
存储在数组中的值:引用类型的数组保存对对象的引用,因此数组中的每个条目都是引用的大小(即32位为4字节)。值类型的数组内联存储值,因此每个元素都将占用所讨论类型的大小。
这个问题可能也很有趣:C#List <double> size vs double [] size
血腥细节
考虑以下代码
var strings = new string[1];
var ints = new int[1];
strings[0] = "hello world";
ints[0] = 42;
附加WinDbg显示以下内容:
首先,让我们看一下值类型数组。
0:000> !dumparray -details 017e2acc
Name: System.Int32[]
MethodTable: 63b9aa40
EEClass: 6395b4d4
Size: 16(0x10) bytes
Array: Rank 1, Number of elements 1, Type Int32
Element Methodtable: 63b9aaf0
[0] 017e2ad4
Name: System.Int32
MethodTable 63b9aaf0
EEClass: 6395b548
Size: 12(0xc) bytes
(C:\Windows\assembly\GAC_32\mscorlib\2.0.0.0__b77a5c561934e089\mscorlib.dll)
Fields:
MT Field Offset Type VT Attr Value Name
63b9aaf0 40003f0 0 System.Int32 1 instance 42 m_value <=== Our value
0:000> !objsize 017e2acc
sizeof(017e2acc) = 16 ( 0x10) bytes (System.Int32[])
0:000> dd 017e2acc -0x4
017e2ac8 00000000 63b9aa40 00000001 0000002a <=== That's the value
首先,我们转储数组和值为42的一个元素。可以看出,大小为16个字节。也就是说,int32值本身为4个字节,常规引用类型的开销为8个字节,数组的长度为另外4个字节。
原始转储显示SyncBlock,方法表int[],长度和值42(十六进制2a)。请注意,SyncBlock位于对象引用的前面。
接下来,让我们看一下,string[]找出附加词的用途。
0:000> !dumparray -details 017e2ab8
Name: System.String[]
MethodTable: 63b74ed0
EEClass: 6395a8a0
Size: 20(0x14) bytes
Array: Rank 1, Number of elements 1, Type CLASS
Element Methodtable: 63b988a4
[0] 017e2a90
Name: System.String
MethodTable: 63b988a4
EEClass: 6395a498
Size: 40(0x28) bytes <=== Size of the string
(C:\Windows\assembly\GAC_32\mscorlib\2.0.0.0__b77a5c561934e089\mscorlib.dll)
String: hello world
Fields:
MT Field Offset Type VT Attr Value Name
63b9aaf0 4000096 4 System.Int32 1 instance 12 m_arrayLength
63b9aaf0 4000097 8 System.Int32 1 instance 11 m_stringLength
63b99584 4000098 c System.Char 1 instance 68 m_firstChar
63b988a4 4000099 10 System.String 0 shared static Empty
>> Domain:Value 00226438:017e1198 <<
63b994d4 400009a 14 System.Char[] 0 shared static WhitespaceChars
>> Domain:Value 00226438:017e1760 <<
0:000> !objsize 017e2ab8
sizeof(017e2ab8) = 60 ( 0x3c) bytes (System.Object[]) <=== Notice the underlying type of the string[]
0:000> dd 017e2ab8 -0x4
017e2ab4 00000000 63b74ed0 00000001 63b988a4 <=== Method table for string
017e2ac4 017e2a90 <=== Address of the string in memory
0:000> !dumpmt 63b988a4
EEClass: 6395a498
Module: 63931000
Name: System.String
mdToken: 02000024 (C:\Windows\assembly\GAC_32\mscorlib\2.0.0.0__b77a5c561934e089\mscorlib.dll)
BaseSize: 0x10
ComponentSize: 0x2
Number of IFaces in IFaceMap: 7
Slots in VTable: 196
首先,我们转储数组和字符串。接下来,我们转储的大小string[]。请注意,WinDbg在System.Object[]此处列出了类型。在这种情况下,对象大小包括字符串本身,因此总大小是数组中的20加上字符串的40。
通过转储实例的原始字节,我们可以看到以下内容:首先是SyncBlock,然后是的方法表object[],然后是数组的长度。之后,我们通过引用方法表找到了另外的4个字节。如上所示,可以通过dumpmt命令对此进行验证。最后,我们找到对实际字符串实例的单个引用。
结论
数组的开销可以按如下方式分解(即32位)
4字节的SyncBlock
数组本身的方法表(类型引用)为4个字节
数组长度为4个字节
引用类型的数组又添加了4个字节来保存实际元素类型的方法表(引用类型的数组位于内部object[])
即,对于值类型数组,开销是12个字节,对于引用类型数组,开销是16个字节。
TA贡献1821条经验 获得超6个赞
我们有一个项目,可处理大量数据(最大2GB)。作为主要存储,我们使用Dictionary<T,T>
。实际上创建了数千个字典。将其更改List<T>
为键和List<T>
值(我们IDictionary<T,T>
自己实现)后,内存使用量减少了约30-40%。
- 3 回答
- 0 关注
- 411 浏览
添加回答
举报