summaryrefslogtreecommitdiff
path: root/src/GF/Text/OCSCyrillic.hs
blob: 0d46969440b113fc1a9275ee0fcdf871ac9ea5c6 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
----------------------------------------------------------------------
-- |
-- Maintainer  : (Maintainer)
-- Stability   : (stable)
-- Portability : (portable)
--
-- > CVS $Date: 2005/04/21 16:23:39 $ 
-- > CVS $Author: bringert $
-- > CVS $Revision: 1.6 $
--
-- (Description of the module)
-----------------------------------------------------------------------------

module GF.Text.OCSCyrillic (mkOCSCyrillic) where

mkOCSCyrillic :: String -> String
mkOCSCyrillic = mkOCSCyrillicWord

mkOCSCyrillicWord :: String -> String
mkOCSCyrillicWord str = case str of
  [] -> []
  ' ' : cs -> ' ' : mkOCSCyrillicWord cs
  '<' : cs -> '<' : spoolMarkup cs  
  '\228' : cs -> toEnum 0x0463 : mkOCSCyrillicWord cs -- ä
  'j' : 'e' : '~' : cs -> toEnum 0x0469 : mkOCSCyrillicWord cs 
  'j' : 'o' : '~' : cs -> toEnum 0x046d : mkOCSCyrillicWord cs
  'j' : 'e' : cs -> toEnum 0x0465 : mkOCSCyrillicWord cs
  'e' : '~' : cs -> toEnum 0x0467 : mkOCSCyrillicWord cs
  'o' : '~' : cs -> toEnum 0x046b : mkOCSCyrillicWord cs
  'j' : 'u' : cs -> toEnum 0x044e : mkOCSCyrillicWord cs
  'j' : 'a' : cs -> toEnum 0x044f : mkOCSCyrillicWord cs 
  'u' : cs -> toEnum 0x0479 : mkOCSCyrillicWord cs
  c : cs -> (mkOCSCyrillicChar c) : mkOCSCyrillicWord cs   

spoolMarkup :: String -> String
spoolMarkup s = case s of
   [] -> [] -- Shouldn't happen
   '>' : cs -> '>' : mkOCSCyrillicWord cs
   c1 : cs -> c1 : spoolMarkup cs

mkOCSCyrillicChar :: Char -> Char
mkOCSCyrillicChar c = case lookup c cc of Just c' -> c' ; _ -> c 
 where 
   cc = zip "abvgdeZziJklmnoprstYfxCqwWUyIE" allOCSCyrillic

allOCSCyrillic :: String
allOCSCyrillic = (map toEnum [0x0430 .. 0x044e])