SuperbChemistry 3.1
[superbchemistry/superbchemistry.git] / extension / SuperbChemistry / Main.xba
index 530cf8d..52080f3 100644 (file)
 <?xml version="1.0" encoding="UTF-8"?>
 <!DOCTYPE script:module PUBLIC "-//OpenOffice.org//DTD OfficeDocument 1.0//EN" "module.dtd">
-<script:module xmlns:script="http://openoffice.org/2000/script" script:name="Main" script:language="StarBasic">&apos; SuperbChemistry version 2.2
-&apos; http://mattmccutchen.net/schem/
-&apos; Written and maintained by Matt McCutchen &lt;matt@mattmccutchen.net&gt;
-&apos;
-&apos; Applies superscript and subscript formatting to chemical formulas in
-&apos; OpenOffice.org Writer documents.
-&apos;
-&apos; Rules:
-&apos; - Quantities [0-9]+ and charges [0-9]*[-+−] are recognized after an element
-&apos;   symbol [A-Z][a-z]? or a closing delimiter [\])}] .  Hyphens are converted
-&apos;   into real minus signs.
-&apos; - A charge sign [-+−] is ignored if it is followed by a letter, digit,
-&apos;   opening delimiter, or [&lt;&gt;] .  (Charges should appear only at the end of a
-&apos;   formula, and we want to avoid matching ordinary hyphens in text.)
-&apos; - When digits followed by a charge sign are recognized, the last digit
-&apos;   becomes part of the charge and the remaining digits become the quantity.
-&apos;   (Charges rarely have absolute value more than 9.)
-&apos; - In cases like X2-, we have to guess whether the digit is an atom/group
-&apos;   quantity or a charge amount.  We guess atom/group quantity if X is H (NH4+),
-&apos;   O (NO3-), a halogen (SbF6-, AlCl4-, etc.), or a closing parenthesis
-&apos;   (Fe(OH)2+; the group likely would not have been parenthesized unless it had
-&apos;   a quantity).  Otherwise we guess charge amount (Fe3+).  This heuristic
-&apos;   should be right most of the time.
-&apos;
-&apos; Examples:
-&apos; C12345 ==&gt; C_{12345}
-&apos; H+ ==&gt; H^+
-&apos; Cl- ==&gt; Cl^-
-&apos; Fe3+ ==&gt; Fe^{3+}
-&apos; SO42- ==&gt; SO_4^{2-}
-&apos; C1232+ ==&gt; C_{123}^{2+}
-&apos; N3- ==&gt; N^{3-}
-&apos; N|_3^- not recognized (| represents &quot;no-width no break&quot;)
-&apos; NH4+ ==&gt; NH_4^+
-&apos; NO3- ==&gt; NO_3^-
-&apos; AlCl4- =&gt; AlCl_4^-
-&apos; Fe(OH)2+ ==&gt; Fe(OH)_2^+
-&apos; O12 ==&gt; O_{12}
-&apos; y4- not recognized
-&apos; x2 not recognized
-&apos; Foo2 not recognized
-&apos; TI-89 not recognized
-&apos;
-&apos; To format the current document, run the FormatDocument macro: go to Tools -&gt;
-&apos; Macros -&gt;  Run Macro... -&gt; My Macros -&gt; SuperbChemistry -&gt; Main -&gt;
-&apos; FormatDocument -&gt; Run.  I realize that this is ugly.  I tried to make the
-&apos; package install a menu item to format the document, but the resulting package
-&apos; caused OpenOffice.org to crash regularly (I didn&apos;t investigate why), so I
-&apos; abandoned that idea.  Note that you can add a menu item as a user
-&apos; customization (Tools -&gt; Customize), and I recommend it if you plan to use
-&apos; SuperbChemistry frequently.
-&apos;
-&apos; FormatDocument uses a sequence of regular expression find-and-replace
-&apos; operations since that was easy to implement and makes the rules easy to
-&apos; change.  The operations appear in the undo history, so you can undo a
-&apos; formatting run by undoing the block of &quot;Replace&quot; entries at the top of the
-&apos; history.
-&apos;
-&apos; I would like to support formatting a selection, but the OpenOffice.org API
-&apos; does not appear to support replace-all within a selection.  I could find
-&apos; within the selection and implement the replacing myself, but that is more
-&apos; work than I want to do.
-&apos;
-&apos; If SuperbChemistry makes a mistake (e.g., recognizes a &quot;formula&quot; that isn&apos;t
-&apos; or formats a formula incorrectly), you can correct the formatting yourself
-&apos; and prevent future runs of the macro from recognizing the offending text by
-&apos; inserting a &quot;No-width no break&quot; character in the middle of it.  This character
-&apos; is available in the &quot;Insert -&gt; Formatting Mark&quot; menu when &quot;Tools -&gt; Options -&gt;
-&apos; Language Settings -&gt; Languages -&gt; Enhanced language support -&gt;
-&apos; Enabled for complex text layout (CTL)&quot; is enabled.
-
-&apos; ==============================================================================
-
-&apos; Regular expression replace in the document,
-&apos; creating superscripts if superb &gt; 0 or subscripts if superb &lt; 0.
-&apos; Used by FormatDocument.
-sub SuperbReplace(doc as object, searchStr as string, replaceStr as string, superb as integer)
-
-dim rd as object
-rd = doc.createReplaceDescriptor()
-
-rd.SearchCaseSensitive = true
-rd.SearchRegularExpression = true
-rd.setSearchString(searchStr)
-rd.setReplaceString(replaceStr)
-
-if superb &lt;&gt; 0 then
-       dim replaceAttrs(1) as new com.sun.star.beans.PropertyValue
-       replaceAttrs(0).Name = &quot;CharEscapement&quot;
-       if superb &gt; 0 then
-               replaceAttrs(0).Value = 33
-       else
-               replaceAttrs(0).Value = -9
-       end if
-       replaceAttrs(1).Name = &quot;CharEscapementHeight&quot;
-       replaceAttrs(1).Value = 58
-       rd.setReplaceAttributes(replaceAttrs)
-end if
-
-doc.replaceAll(rd)
-
-end sub
-
-&apos; Formats the current document
-sub FormatDocument
-
-&apos; Idiom: Match something and tag it on the left or right with @x@
-&apos; for further processing.  If the replacement text could use
-&apos; backreferences, this would be easier.  (I think backreferences were added
-&apos; since I originally wrote this code, but I see no need to rewrite it to take
-&apos; advantage of them. - Matt 2008-10-26)
-
-&apos; Tag candidate charges following symbols or ), but not in compound words, etc.
-&apos; Acceptable next character.  (Has to be before end of line to avoid matching @g@ tag itself.)
-SuperbReplace(ThisComponent, &quot;([A-Z][a-z]?|[\])}])[0-9]*[-+−][^[({A-Za-z0-9&lt;&gt;]&quot;, &quot;&amp;@G@&quot;, 0)
-&apos; Retag in front.
-SuperbReplace(ThisComponent, &quot;.@G@&quot;, &quot;@g@&amp;&quot;, 0)
-&apos; End of line.
-SuperbReplace(ThisComponent, &quot;([A-Z][a-z]?|[\])}])[0-9]*[-+−]$&quot;, &quot;&amp;@g@&quot;, 0)
-
-&apos; Some groups grab a single following digit as a quantity rather than a charge amount.
-&apos; See detailed rationale above.
-SuperbReplace(ThisComponent, &quot;(H|O|F|Cl|Br|I|\))[0-9]&quot;, &quot;&amp;@n@&quot;, 0)
-
-&apos; Real minus signs in charges.
-SuperbReplace(ThisComponent, &quot;-@g@&quot;, &quot;−@g@&quot;, 0)
-
-&apos; Make charges: at most one digit.
-SuperbReplace(ThisComponent, &quot;[0-9]?[−+]@g@&quot;, &quot;@q@&amp;&quot;, 1)
-
-&apos; Remove the O and ) markers in case of O57.
-SuperbReplace(ThisComponent, &quot;@n@&quot;, &quot;&quot;, 0)
-
-&apos; Tag quantities: as many digits as we can still grab.
-SuperbReplace(ThisComponent, &quot;([A-Z][a-z]?|[\])}])[0-9]+&quot;, &quot;&amp;@n@&quot;, 0)
-
-&apos; Make quantities.
-SuperbReplace(ThisComponent, &quot;[0-9]+@n@&quot;, &quot;&amp;&quot;, -1)
-
-&apos; Clean up all markers.
-SuperbReplace(ThisComponent, &quot;@[gGnq]@&quot;, &quot;&quot;, 0)
-
-end sub
+<script:module xmlns:script="http://openoffice.org/2000/script" script:name="Main" script:language="StarBasic">Option Explicit
+
+Function HaveSelection(doc As Object)
+       Dim sel as Object
+       sel = doc.CurrentController.Selection
+       If sel.Count &gt; 1 Then
+               HaveSelection = True
+               Exit Function
+       End If
+       Dim s0
+       s0 = sel.getByIndex(0)
+       If s0.Text.compareRegionStarts(s0.Start, s0.End) = 0 Then
+               HaveSelection = False
+       Else
+               HaveSelection = True
+       End If
+End Function
+
+&apos; Regular expression replace in the document, creating superscripts if
+&apos; superb &gt; 0 or subscripts if superb &lt; 0.
+Sub SuperbReplace(doc As Object, searchRegex As String, replacePattern As String, superb As Integer)
+
+       Dim rd As Object
+       rd = doc.createReplaceDescriptor()
+
+       rd.SearchCaseSensitive = true
+       rd.SearchRegularExpression = true
+       rd.setSearchString(searchRegex)
+       rd.setReplaceString(replacePattern)
+
+       If superb &lt;&gt; 0 Then
+               Dim replaceAttrs(1) As New com.sun.star.beans.PropertyValue
+               replaceAttrs(0).Name = &quot;CharEscapement&quot;
+               If superb &gt; 0 Then
+                       replaceAttrs(0).Value = 33
+               Else
+                       &apos; The default escapement for subscripts is -33, which looked bad to me in
+                       &apos; chemical formulas.  This looks better.  Modify to your taste.
+                       replaceAttrs(0).Value = -9
+               End If
+               replaceAttrs(1).Name = &quot;CharEscapementHeight&quot;
+               replaceAttrs(1).Value = 58
+               rd.setReplaceAttributes(replaceAttrs)
+       End If
+
+       doc.replaceAll(rd)
+
+End Sub
+
+Sub ReplaceInSelection(doc As Object, searchRegex As String, replacePattern As String)
+
+       Dim frame As Object, dispatcher As Object
+       frame = doc.CurrentController.Frame
+       dispatcher = createUnoService(&quot;com.sun.star.frame.DispatchHelper&quot;)
+
+       Dim args(6) As New com.sun.star.beans.PropertyValue
+       args(0).Name = &quot;SearchItem.AlgorithmType&quot;
+       args(0).Value = 1
+       args(1).Name = &quot;SearchItem.SearchFlags&quot;
+       args(1).Value = &amp;H1800  &apos; Search in selection
+       args(2).Name = &quot;SearchItem.SearchString&quot;
+       args(2).Value = searchRegex
+       args(3).Name = &quot;SearchItem.ReplaceString&quot;
+       args(3).Value = replacePattern
+       args(4).Name = &quot;SearchItem.Command&quot;
+       args(4).Value = 3
+       args(5).Name = &quot;SearchItem.AlgorithmType2&quot;
+       args(5).Value = 2
+       args(6).Name = &quot;Quiet&quot;
+       args(6).Value = true
+
+       dispatcher.executeDispatch(frame, &quot;.uno:ExecuteSearch&quot;, &quot;&quot;, 0, args())
+
+End Sub
+
+Global formatSelectionWarningShown As Boolean
+&apos; I haven&apos;t found a way to initialize the variable, but it looks like its
+&apos; default value is treated as false in an if statement.
+&apos;formatSelectionWarningShown = False
+
+Sub FormatSelectionOrDocumentDebug()
+       &apos; Replacing with an empty replacement string triggers a bug in LibreOffice
+       &apos; (https://bugs.documentfoundation.org/show_bug.cgi?id=136577), so we must
+       &apos; avoid it.  Fortunately, avoiding it is pretty straightforward.
+
+       &apos; Step 1: Insert @m@ between an item and a number or charge that may be part of
+       &apos; a chemical formula (subject to later checks).
+       If HaveSelection(ThisComponent) Then
+               &apos; doc.replaceAll is not capable of searching a selection, while the
+               &apos; dispatch-based replace API uses the current format options in the
+               &apos; &quot;Find &amp; Replace&quot; dialog and does not let us change them, which means that
+               &apos; (1) existing settings can break things and (2) we cannot make superscripts
+               &apos; and subscripts.  We do the best we can by using one dispatch-based replace
+               &apos; to tag all the sequences we want to operate on (which loses the selection in
+               &apos; OpenOffice anyway) and then proceed with replaceAll calls on the whole
+               &apos; document, which will only operate on the already tagged sequences.
+               If Not formatSelectionWarningShown Then
+                       MsgBox &quot;Due to limitations in the OpenOffice/LibreOffice API, the &quot; &amp; _
+                               &quot;&quot;&quot;Format selection&quot;&quot; command may not process some chemical formulas &quot; &amp; _
+                               &quot;in the selection or may apply incorrect formatting if any format &quot; &amp; _
+                               &quot;options are active in the &quot;&quot;Find &amp; Replace&quot;&quot; dialog box.  If this &quot; &amp; _
+                               &quot;happens, just undo the command (if any changes were made), clear the &quot; &amp; _
+                               &quot;format options in the &quot;&quot;Find &amp; Replace&quot;&quot; dialog box (focus the &quot; &amp; _
+                               &quot;&quot;&quot;Find&quot;&quot; field, click &quot;&quot;No Format&quot;&quot;, and repeat for the &quot;&quot;Replace&quot;&quot; &quot; &amp; _
+                               &quot;field), and run &quot;&quot;Format selection&quot;&quot; again.&quot; &amp; Chr$(13) &amp; Chr$(13) &amp; _
+                               &quot;This message is always shown on the first &quot;&quot;Format selection&quot;&quot; &quot; &amp; _
+                               &quot;command in each OpenOffice/LibreOffice session because &quot; &amp; _
+                               &quot;SuperbChemistry has no way to detect whether format options are &quot; &amp; _
+                               &quot;active in &quot;&quot;Find &amp; Replace&quot;&quot;.&quot;, _
+                               0, &quot;SuperbChemistry &quot;&quot;Format selection&quot;&quot; notice&quot;
+                       formatSelectionWarningShown = True
+               End If
+               ReplaceInSelection(ThisComponent, &quot;(?&lt;=[A-Z][a-z]?|[\])}])[-+−0-9]+&quot;, &quot;@m@&amp;&quot;)
+       Else
+               SuperbReplace(ThisComponent, &quot;(?&lt;=[A-Z][a-z]?|[\])}])[-+−0-9]+&quot;, &quot;@m@&amp;&quot;, 0)
+       End If
+
+       &apos; Step 2: Insert @c@ after a charge symbol, if it&apos;s followed by one of the
+       &apos; allowed characters for the second kind of &quot;recognized sequence&quot; described in
+       &apos; the readme.
+       SuperbReplace(ThisComponent, &quot;(?&lt;=@m@)([0-9]*[-+−])(?=[ \t\])}.,:;?!&apos;&quot;&quot;]|$)&quot;, &quot;&amp;@c@&quot;, 0)
+
+       &apos; Step 3: Real minus signs in charges.
+       SuperbReplace(ThisComponent, &quot;-@c@&quot;, &quot;−@c@&quot;, 0)
+
+       &apos; Step 4: Some groups grab a single following digit as a quantity rather than a
+       &apos; charge amount.  Insert @sq@ marker to prevent the charge from grabbing the
+       &apos; digit.
+       SuperbReplace(ThisComponent, &quot;(?&lt;=(H|O|F|Cl|Br|I|[\])}])@m@)[0-9]&quot;, &quot;&amp;@sq@&quot;, 0)
+
+       &apos; Step 5: Each charge grabs at most one digit and moves the @c@ in front to
+       &apos; prevent the quantity from grabbing the digit.
+       SuperbReplace(ThisComponent, &quot;([0-9]?[−+])@c@&quot;, &quot;@c@$1&quot;, 1)
+
+       &apos; Step 6: Remove any @sq@ markers so items can grab all the digits that follow
+       &apos; for the quantity.
+       SuperbReplace(ThisComponent, &quot;(.)@sq@&quot;, &quot;$1&quot;, 0)
+
+       &apos; At this point, we have only @m@ and @c@ markers left.
+
+       &apos; Step 7: Format quantities: as many digits as we can still grab.  The digits
+       &apos; must be followed by one of the allowed characters for the first kind of
+       &apos; &quot;recognized sequence&quot; described by a readme or by @, which we assume is part
+       &apos; of a @c@ tag we added in step 2.  The allowed characters A-Z\[({ represent
+       &apos; the beginning of another item; the other allowed characters are the same as
+       &apos; in step 2.
+       SuperbReplace(ThisComponent, &quot;(?&lt;=@m@)[0-9]+(?=[@A-Z\[({ \t\])}.,:;?!&apos;&quot;&quot;]|$)&quot;, &quot;&amp;&quot;, -1)
+
+       &apos; Step 8: Clean up @c@ markers.  We know there is a charge sign after each.
+       SuperbReplace(ThisComponent, &quot;@c@(.)&quot;, &quot;$1&quot;, 0)
+
+       &apos; Step 9: Clean up @m@ markers.  We know there is some character before each.
+       SuperbReplace(ThisComponent, &quot;(.)@m@&quot;, &quot;$1&quot;, 0)
+
+End Sub
+
+Dim madeChanges As Boolean
+
+Sub UndoListener_undoActionAdded()
+End Sub
+Sub UndoListener_actionUndone()
+End Sub
+Sub UndoListener_actionRedone()
+End Sub
+Sub UndoListener_allActionsCleared()
+End Sub
+Sub UndoListener_redoActionsCleared()
+End Sub
+Sub UndoListener_resetAll()
+End Sub
+Sub UndoListener_enteredContext()
+End Sub
+Sub UndoListener_enteredHiddenContext()
+End Sub
+Sub UndoListener_leftContext()
+       madeChanges = True
+End Sub
+Sub UndoListener_leftHiddenContext()
+End Sub
+Sub UndoListener_cancelledContext()
+End Sub
+
+Sub FormatSelectionOrDocument()
+
+       Dim undoActionName As String
+       If HaveSelection(ThisComponent) Then
+               undoActionName = &quot;SuperbChemistry: Format selection&quot;
+       Else
+               undoActionName = &quot;SuperbChemistry: Format document&quot;
+       End If
+       ThisComponent.UndoManager.enterUndoContext(undoActionName)
+
+       On Error Goto ErrorHandler
+       FormatSelectionOrDocumentDebug
+       On Error Goto 0
+
+       ThisComponent.UndoManager.leaveUndoContext()
+       Exit Sub
+
+ErrorHandler:
+
+       &apos; If our undo context is nonempty, we want to undo the generated action.
+       &apos; If not, we do not want to undo as that would undo the user&apos;s previous
+       &apos; action.  If we just check whether the title of the last undoable action
+       &apos; is &quot;SuperbChemistry: Format (selection|document)&quot;, that might be wrong if
+       &apos; the user ran FormatDocument twice in a row: probably unlikely, but the
+       &apos; completely correct check is not that hard.
+       Dim listener As Object
+       listener = CreateUnoListener(&quot;UndoListener_&quot;, &quot;com.sun.star.document.XUndoManagerListener&quot;)
+       madeChanges = False
+       ThisComponent.UndoManager.addUndoManagerListener(listener)
+       ThisComponent.UndoManager.leaveUndoContext()
+       ThisComponent.UndoManager.removeUndoManagerListener(listener)
+       If madeChanges Then
+               ThisComponent.UndoManager.undo()
+               ThisComponent.UndoManager.clearRedo()
+       End If
+
+       MsgBox &quot;SuperbChemistry encountered an unexpected error:&quot; &amp; Chr$(13) &amp; Chr$(13) &amp; _
+               &quot;Code &quot; &amp; Err &amp; &quot;: &quot; &amp; Error$ &amp; Chr$(13) &amp; Chr$(13) &amp; _
+               &quot;Any changes made so far have been undone.&quot; &amp; Chr$(13) &amp; Chr$(13) &amp; _
+               &quot;SuperbChemistry needed to catch the error in order to leave your undo &quot; &amp; _
+               &quot;history in a consistent state.  If the problem is reproducible and you &quot; &amp; _
+               &quot;want to see the precise error location, run the FormatSelectionOrDocumentDebug &quot; &amp; _
+               &quot;macro, but be advised that it may generate multiple entries in the undo &quot; &amp; _
+               &quot;history and will not undo them on error.&quot;, _
+               0, &quot;SuperbChemistry internal error&quot;
+       On Error Goto 0
+End Sub
 
 </script:module>
\ No newline at end of file