-----------------------------------------------------------------------
--         FILE:  xindex-yannis.lua
--  DESCRIPTION:  configuration file for xindex.lua 
-- REQUIREMENTS:  
--       AUTHOR:  Herbert VoÃŸ
--      LICENSE:  LPPL1.3
--
-- $Id: xindex-yannis.lua 22 2022-02-07 12:18:15Z hvoss $
-----------------------------------------------------------------------

if not modules then modules = { } end modules ['xindex-yannis'] = {
      version = 0.64,
      comment = "main configuration to xindex.lua",
       author = "Herbert Voss",
    copyright = "Herbert Voss",
      license = "LPPL 1.3"
}

itemPageDelimiter = ","     -- Hello, 14
compressPages     = true    -- something like 12--15, instead of 12,13,14,15. the |( ... |) syntax is still valid
fCompress	  = false    -- 3f -> page 3, 4 and 3ff -> page 3, 4, 5
minCompress       = 2       -- 14--17 or 
rangeSymbol       = "-"     -- 14-17 instead of -- 
numericPage       = true    -- for non numerical pagenumbers, like "VI-17"
sublabels         = {"", "-\\,", "--\\,", "---\\,"} -- for the (sub(sub(sub-items  first one is for item
pageNoPrefixDel   = ""     -- a delimiter for page numbers like "VI-17"  -- not used !!!
indexOpening      = ""     -- commands after \begin{theindex}
idxnewletter      = "\\textbf"  -- Only valid if -n is not set
envStart          = "\\begin{theindex}"  
envStop           = "\\end{theindex}"


--[[
    Each character's position in this array-like table determines its 'priority'.
    Several characters in the same slot have the same 'priority'.
]]
alphabet_lower = { --   for sorting
    { 'Î±', 'Î¬', 'á½°', 'á¾¶', 'á¼€', 'á¼„', 'á¼‚', 'á¼†', 'á¼', 'á¼…', 'á¼ƒ', 'á¼‡', 'á¾³', 'á¾´', 'á¾²', 'á¾·', 'á¾€', 'á¾„', 'á¾‚', 'á¾†', 'á¾', 'á¾…', 'á¾ƒ', 'á¾‡' },
    { 'Î²', 'Ï' },
    { 'Î³' },
    { 'Î´' },
    { 'Îµ', 'Î', 'á½²', 'á¼', 'á¼”', 'á¼’', 'á¼‘', 'á¼•', 'á¼“' },
    { 'Î¶' },
    { 'Î·', 'Î®', 'á½´', 'á¿†', 'á¼ ', 'á¼¤', 'á¼¢', 'á¼¦', 'á¼¡', 'á¼¥', 'á¼£', 'á¼§', 'á¿ƒ', 'á¿„', 'á¿‚', 'á¿‡', 'á¾', 'á¾”', 'á¾’', 'á¾–', 'á¾‘', 'á¾•', 'á¾“', 'á¾—' },
    { 'Î¸' },
    { 'Î¹', 'Î¯', 'á½¶', 'á¿–', 'á¼°', 'á¼´', 'á¼²', 'á¼¶', 'á¼±', 'á¼µ', 'á¼³', 'á¼·', 'ÏŠ', 'Î', 'á¿’', 'á¿—' },
    { 'Îº' },
    { 'Î»' },
    { 'Î¼' },
    { 'Î½' },
    { 'Î¾' },
    { 'Î¿', 'ÏŒ', 'á½¸', 'á½€', 'á½„', 'á½‚', 'á½', 'á½…', 'á½ƒ' },
    { 'Ï€' },
    { 'Ï' },
    { 'Ïƒ', 'Ï‚' },
    { 'Ï„' },
    { 'Ï…', 'Ï', 'á½º', 'á¿¦', 'á½', 'á½”', 'á½’', 'á½–', 'á½‘', 'á½•', 'á½“', 'á½—', 'Ï‹', 'Î°', 'á¿¢', 'á¿§' },
    { 'Ï†' },
    { 'Ï‡' },
    { 'Ïˆ' },
    { 'Ï‰', 'ÏŽ', 'á½¼', 'á¿¶', 'á½ ', 'á½¤', 'á½¢', 'á½¦', 'á½¡', 'á½¥', 'á½£', 'á½§', 'á¿³', 'á¿´', 'á¿²', 'á¿·', 'á¾ ', 'á¾¤', 'á¾¢', 'á¾¦', 'á¾¡', 'á¾¥', 'á¾£', 'á¾§' },
    { 'a', 'Ã¡', 'Ã ', 'Ã¤', 'Ã¥', 'Ã¦', },
    { 'b' },
    { 'c', 'Ã§' },
    { 'd' },
    { 'e', 'Ã©', 'Ã¨', 'Ã«' },
    { 'f' },
    { 'g' },
    { 'h' },
    { 'i', 'Ã', 'Ã¬', 'Ã¯' },
    { 'j' },
    { 'k' },
    { 'l' },
    { 'm' },
    { 'n', 'Ã±' },
    { 'o', 'Ã³', 'Ã²', 'Ã¶', 'Ã¸', 'Å“'},
    { 'p' },
    { 'q' },
    { 'r' },
    { 's', 'Å¡', 'ÃŸ' },
    { 't' },
    { 'u', 'Ãº', 'Ã¹', 'Ã¼' },
    { 'v' },
    { 'w' },
    { 'x' },
    { 'y', 'Ã½', 'Ã¿' },
    { 'z', 'Å¾' },
    { 'Ð°' },
    { 'Ð±' },
    { 'Ð²' },
    { 'Ð³', 'Ñ“' },
    { 'Ð´' },
    { 'Ðµ', 'Ñ‘' },
    { 'Ð¶' },
    { 'Ð·' },
    { 'Ð¸', 'Ñ–' },
    { 'Ð¹' },
    { 'Ðº' },
    { 'Ð»' },
    { 'Ð¼' },
    { 'Ð½' },
    { 'Ð¾' },
    { 'Ð¿' },
    { 'Ñ€' },
    { 'Ñ' },
    { 'Ñ‚' },
    { 'Ñƒ' },
    { 'Ñ„' },
    { 'Ñ…' },
    { 'Ñ†' },
    { 'Ñ‡' },
    { 'Ñˆ' },
    { 'Ñ‰' },
    { 'ÑŠ' },
    { 'Ñ‹' },
    { 'ÑŒ' },
    { 'Ñ' },
    { 'ÑŽ' },
    { 'Ñ' },
}
alphabet_upper = { -- for sorting
    { 'Î‘', 'Î†', 'á¼ˆ', 'á¼Œ', 'á¼Š', 'á¼Ž', 'á¼‰', 'á¼', 'á¼‹', 'á¼', 'á¾¼', 'á¾ˆ', 'á¾Œ', 'á¾Š', 'á¾Ž', 'á¾‰', 'á¾', 'á¾‹', 'á¾' },
    { 'Î’' },
    { 'Î“' },
    { 'Î”' },
    { 'Î•', 'Îˆ', 'á¼˜', 'á¼œ', 'á¼š', 'á¼™', 'á¼', 'á¼›' },
    { 'Î–' },
    { 'Î—', 'Î‰', 'á¼¨', 'á¼¬', 'á¼ª', 'á¼®', 'á¼©', 'á¼', 'á¼«', 'á¼¯', 'á¿Œ', 'á¾˜', 'á¾œ', 'á¾š', 'á¾ž', 'á¾™', 'á¾', 'á¾Ÿ' },
    { 'Î˜' },
    { 'Î™', 'ÎŠ', 'á¼¸', 'á¼¼', 'á¼º', 'á¼¾', 'á¼¹', 'á¼½', 'á¼»', 'á¼¿', 'Îª' },
    { 'Îš' },
    { 'Î›' },
    { 'Îœ' },
    { 'Î' },
    { 'Îž' },
    { 'ÎŸ', 'ÎŒ', 'á½ˆ', 'á½Œ', 'á½Š', 'á½‰', 'á½', 'á½‹' },
    { 'Î ' },
    { 'Î¡' },
    { 'Î£' },
    { 'Î¤' },
    { 'Î¥', 'ÎŽ', 'á½™', 'á½', 'á½›', 'á½Ÿ', 'Î«' },
    { 'Î¦' },
    { 'Î§' },
    { 'Î¨' },
    { 'Î©', 'Î', 'á½¨', 'á½¬', 'á½ª', 'á½®', 'á½©', 'á½', 'á½«', 'á½¯', 'á¿¼', 'á¾©', 'á¾', 'á¾«', 'á¾¯', 'á¾¨', 'á¾¬', 'á¾ª', 'á¾®' },
    { 'A', 'Ã', 'Ã€', 'Ã„', 'Ã…', 'Ã†'},
    { 'B' },
    { 'C', 'Ã‡' },
    { 'D' },
    { 'E', 'Ãˆ', 'Ãˆ', 'Ã‹' },
    { 'F' },
    { 'G' },
    { 'H' },
    { 'I', 'Ã', 'ÃŒ', 'Ã' },
    { 'J' },
    { 'K' },
    { 'L' },
    { 'M' },
    { 'N', 'Ã‘' },
    { 'O', 'Ã“', 'Ã’', 'Ã–', 'Ã˜','Å’' },
    { 'P' },
    { 'Q' },
    { 'R' },
    { 'S', 'Å ' },
    { 'T' },
    { 'U', 'Ãš', 'Ã™', 'Ãœ' },
    { 'V' },
    { 'W' },
    { 'X' },
    { 'Y', 'Ã', 'Å¸' },
    { 'Z', 'Å½' },
    { 'Ð' },
    { 'Ð‘' },
    { 'Ð’' },
    { 'Ð“', 'Ðƒ' },
    { 'Ð”' },
    { 'Ð•', 'Ð' },
    { 'Ð–' },
    { 'Ð—' },
    { 'Ð˜', 'Ð†' },
    { 'Ð™' },
    { 'Ðš' },
    { 'Ð›' },
    { 'Ðœ' },
    { 'Ð' },
    { 'Ðž' },
    { 'ÐŸ' },
    { 'Ð ' },
    { 'Ð¡' },
    { 'Ð¢' },
    { 'Ð£' },
    { 'Ð¤' },
    { 'Ð¥' },
    { 'Ð¦' },
    { 'Ð§' },
    { 'Ð¨' },
    { 'Ð©' },
    { 'Ðª' },
    { 'Ð«' },
    { 'Ð¬' },
    { 'Ð' },
    { 'Ð®' },
    { 'Ð¯' },
}


function SORTendhook(list)
  print ("We have "..#list.." total list entries")
  local greek = {}
  local latin = {}
  local cyrillic = {}
  local symbols = {}
  local numbers = {}
  local others = {}
  local firstChar, charType
  local firstCharNumber
  local v
  for i=1,#list do
    v = list[i]
    firstChar = NormalizedUppercase(utf.sub(v["sortChar"],1,1))
    v["sortChar"] = firstChar -- to be sure it is an uppercase unicode char
    firstCharNumber = string.utfvalue(firstChar)
    charType = getCharType(firstChar)
--    print (utf.sub(v["sortChar"],1,1).."->"..firstChar.." ("..firstCharNumber..") ".." ("..charType..")")
    if charType == 0 then 
      symbols[#symbols+1] = v
    elseif charType == 1 then 
      numbers[#numbers+1] = v
    elseif firstCharNumber > 0x052F then  -- 0x052F is last cyrillic character
      others[#others+1] = v
    elseif firstCharNumber >= 0x0400 then -- 0x0400-0x052F cyrillic characters
      cyrillic[#cyrillic+1] = v
    elseif firstCharNumber <= 0x03FF then -- 0x03FF is last greek character
      if firstCharNumber >= 0x0370 then
        greek[#greek+1] = v               -- 0x0370-0x03FF greek characters
      elseif firstCharNumber <= 0x024F then
        if firstCharNumber >= 0x041 then  -- 0x041-0x024F latin character
          latin[#latin+1] = v
        else
          others[#others+1] = v           -- everything else
        end
      end
    end
  end
  print ("We have "..#greek.." Greek entries")
  print ("We have "..#latin.." Latin entries")
  print ("We have "..#cyrillic.." Cyrillic entries")
  print ("We have "..#symbols.." Symbol entries")
  print ("We have "..#numbers.." Number entries")
  print ("We have "..#others.." other entries")
  list = {}
  for i = 1,#greek do list[#list+1] = greek[i] end
  list[#list]["Macro"] = "\\vspace{1cm}"
  for i = 1,#latin do list[#list+1] = latin[i] end
  list[#list]["Macro"] = "\\vspace{1cm}"
  for i = 1,#cyrillic do list[#list+1] = cyrillic[i] end
  list[#list]["Macro"] = "\\vspace{1cm}"
  for i = 1,#symbols do list[#list+1] = symbols[i] end
  for i = 1,#numbers do list[#list+1] = numbers[i] end
  for i = 1,#others do list[#list+1] = others[i] end
  print ("Sorted "..#list.." entries")
  return list
end