<div dir="ltr">I&#39;ve used code like the following example in similar situations and I&#39;ve always (after a lot of profiling, trial and error) managed to get the (ugly) Swift code as fast as the C/C++ code.<div><br></div><div><div>struct UnsafeStatic19x19&lt;E&gt; {</div><div>    var storage: (</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E,</div><div>    E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E, E</div><div>    )</div><div>    subscript(x: Int, y: Int) -&gt; E {</div><div>        get {</div><div>            // No index out of bounds check</div><div>            var m = self // &lt;-- This workaround will be optimized away.</div><div>            return withUnsafeBytes(of: &amp;m) {</div><div>                let byteOffset = MemoryLayout&lt;E&gt;.stride * (x + y*19)</div><div>                return $0.load(fromByteOffset: byteOffset, as: E.self)</div><div>            }</div><div>        }</div><div>        set {</div><div>            withUnsafeMutableBytes(of: &amp;self) {</div><div>                let byteOffset = MemoryLayout&lt;E&gt;.stride * (x + y*19)</div><div>                $0.storeBytes(of: newValue, toByteOffset: byteOffset, as: E.self)</div><div>            }</div><div>        }</div><div>    }</div><div>}</div></div><div><br></div><div>It isn&#39;t pretty but it works (haven&#39;t tried this code example though, but you get the idea).</div><div><br></div><div><br></div><div>I wish it was possible to write something like<br></div><div>struct StaticArray&lt;Element, Count&gt; {</div><div>    ...</div><div>}</div><div>instead (a statically allocated array with type-level Count as well as Element).</div><div><br></div><div>/Jens</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Apr 17, 2017 at 7:52 PM, Anders Kierulf via swift-evolution <span dir="ltr">&lt;<a href="mailto:swift-evolution@swift.org" target="_blank">swift-evolution@swift.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Swift needs a datatype that contains a fixed number of a given type; basically a simple fixed-size array.<br>
<br>
Motivation: I’ve been porting code for Monte Carlo Tree Search in my Go-playing program from C++ to Swift. Performance is crucial for this code, as more simulations lead to better play. After the initial port, the Swift code was more than 10x slower than my C++ code. After several weeks of optimizing, profiling, and digging through disassembly, I’ve gotten to within a factor of 2. Most of that gain came from using the ugly workaround of importing fixed-size arrays from C.<br>
<br>
My app is designed for a 19x19 (or smaller) Go board, not an arbitrary N x N board, so I don’t want to pay the high cost of variable-size data structures in the lowest levels of my app. Most apps are not like this, and most of my app is not, but this kernel of my app needs to be fast. Heap allocations, reference counting, and indirections all slow down the code. I just need a fixed size of memory that I can access like an array, and Swift doesn’t let me do that.<br>
<br>
Workaround: By importing an array from C, I can allocate a blob of memory on the stack or include it in a struct. I can then use UnsafeRawPointer to access that blob like an array (see details in SR-4548). This is ugly, but it works, and it is much faster than using a Swift array. However, I’m stymied by SR-4542, which causes mutability to spread like a plague through client code.<br>
<br>
(SR-4542: Calling a function taking an UnsafeRawPointer forces the parameter to be passed as inout, which means the method must be mutating. UnsafeMutableRawPointer should require inout, UnsafeRawPointer should not.)<br>
<br>
Proposal: UnsafeMutablePointer almost provides what I need. However, it can only allocate memory on the heap, or it can take a given blob of memory and interpret it as something else. What’s missing is a way to allocate typed memory of a certain size on the stack or in a struct. For example, something like this, with support for subscripts, limited to value types:<br>
<br>
    var foo = UnsafeMemory&lt;Int64&gt;(count: 6)<br>
or<br>
    var bar = FixedSizeArray&lt;UInt32&gt;(<wbr>repeating: 0, count: 380)<br>
<br>
Alternatives:<br>
(1) C arrays are currently imported as tuples, so extending tuples with subscripts and adding a way to create tuples with a specific count of the same type could address this need. However, I don’t think this fits well with the concept of tuples.<br>
(2) Changing the Array type to allow a fixed size could be considered in the future. ‘count’ and ‘capacity’ would be fixed and only known to the compiler, not stored with the data. However, I suspect the consequences would be far-reaching, and thus I don’t see this happening soon.<br>
<br>
An UnsafeMemory type would be a limited addition that fits in well with the existing low-level Pointer module, and fills a gap in the capabilities of Swift. The Pointer module helps implement low-level, performance-critical code, and not being able to create data on the stack is a serious omission. Jumping through C hoops is not a solution.<br>
<br>
Anders Kierulf<br>
<br>
______________________________<wbr>_________________<br>
swift-evolution mailing list<br>
<a href="mailto:swift-evolution@swift.org">swift-evolution@swift.org</a><br>
<a href="https://lists.swift.org/mailman/listinfo/swift-evolution" rel="noreferrer" target="_blank">https://lists.swift.org/<wbr>mailman/listinfo/swift-<wbr>evolution</a><br>
</blockquote></div><br></div>