<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Thu, Oct 20, 2016 at 7:30 AM, David Sweeris <span dir="ltr">&lt;<a href="mailto:davesweeris@mac.com" target="_blank">davesweeris@mac.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto"><div>Sent from my iPhone</div><span class=""><div><br>On Oct 20, 2016, at 09:03, Jonathan S. Shapiro via swift-evolution &lt;<a href="mailto:swift-evolution@swift.org" target="_blank">swift-evolution@swift.org</a>&gt; wrote:<br><br></div></span><blockquote type="cite"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><span class="">On Thu, Oct 20, 2016 at 12:12 AM, Austin Zheng via swift-evolution <span dir="ltr">&lt;<a href="mailto:swift-evolution@swift.org" target="_blank">swift-evolution@swift.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><br></div></blockquote></span><span class=""><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"> Freeze the set of allowed emoji to whatever the current version of the Unicode spec defines...</div></blockquote><div><br></div><div>UAX31 won&#39;t include emojis in either space, because there is no clear consensus about where they belong (identifiers or operators). Individual languages can certainly add them to one space or the other, but should take care not to cross-contaminate. So if we add them to operators, we need to exclude any that are already part of normal identifiers and vice versa. That sanity restriction is technically necessary, but it shouldn&#39;t be an inconvenience in practical terms.</div></span></div></div></div></blockquote><br><div>My understanding (which is admittedly fuzzy) is that the distinction between operators and identifiers is only &quot;technically necessary&quot; because allowing characters to be both causes the parsing algorithm lose its virtual mind, and it takes a century for it to figure out what&#39;s going on. What I don&#39;t recall being discussed before is whether that&#39;s a blanket penalty or if the compile times increases are proportional to the amount overlap between the two character sets.</div></div></blockquote><div><br></div><div>The hard requirements are:</div><div><ol><li>Nothing in identifier start can be in operator start or operator continue. [*]</li><li>Nothing in operator start can be in identifier start or identifier continue. [*]<br></li><li>Nothing in syntactic punctuation (period, brackets, parens, and so forth) can be in either type of identifier without creating a lot of serious hair. You can see one example of hair in the &quot;double dots&quot; rule.<br></li></ol></div><div>If these requirements are not preserved, the consequence is that white space becomes required between identifiers and operators. So, for example, without these rules:</div><div><br></div></div></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div class="gmail_extra"><div class="gmail_quote"><div>a+b    // gets broken</div></div></div></blockquote><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div class="gmail_extra"><div class="gmail_quote"><div>a + b  // works</div></div></div></blockquote><div class="gmail_extra"><div class="gmail_quote"><div><br></div><div>The presence of dots in operators is actually causing a whole bunch of constraints to get introduced that I&#39;m going to talk about in a moment.</div><div><br></div><div><br></div><div>Jonathan</div></div></div></div>