Viewing file: PVA.pl (29.9 KB) -rw-rw-rw- Select action/file-type: (+) | (+) | (+) | Code (+) | Session (+) | (+) | SDB (+) | (+) | (+) | (+) | (+) | (+) |
# !!!!!!! DO NOT EDIT THIS FILE !!!!!!!
# This file is built by mktables from e.g. UnicodeData.txt.
# Any changes made here will be lost!
%utf8::PropertyAlias = (
'sc',
'Script',
'xonfkd',
'ExpandsOnNFKD',
'patsyn',
'PatternSyntax',
'nfkcqc',
'NFKCQuickCheck',
'oalpha',
'OtherAlphabetic',
'gcb',
'GraphemeClusterBreak',
'nfcqc',
'NFCQuickCheck',
'ids',
'IDStart',
'lb',
'LineBreak',
'stc',
'SimpleTitlecaseMapping',
'xonfkc',
'ExpandsOnNFKC',
'patws',
'PatternWhiteSpace',
'tc',
'TitlecaseMapping',
'lower',
'Lowercase',
'idst',
'IDSTrinaryOperator',
'radical',
'Radical',
'fcnfkc',
'FCNFKCClosure',
'dm',
'DecompositionMapping',
'slc',
'SimpleLowercaseMapping',
'wspace',
'WhiteSpace',
'di',
'DefaultIgnorableCodePoint',
'jsn',
'JamoShortName',
'nt',
'NumericType',
'ea',
'EastAsianWidth',
'ahex',
'ASCIIHexDigit',
'alpha',
'Alphabetic',
'uc',
'UppercaseMapping',
'dia',
'Diacritic',
'gc',
'GeneralCategory',
'xids',
'XIDStart',
'oupper',
'OtherUppercase',
'wb',
'WordBreak',
'math',
'Math',
'sb',
'SentenceBreak',
'qmark',
'QuotationMark',
'nfdqc',
'NFDQuickCheck',
'ideo',
'Ideographic',
'blk',
'Block',
'odi',
'OtherDefaultIgnorableCodePoint',
'hst',
'HangulSyllableType',
'bidim',
'BidiMirrored',
'olower',
'OtherLowercase',
'na',
'Name',
'hyphen',
'Hyphen',
'xidc',
'XIDContinue',
'oidc',
'OtherIDContinue',
'bidic',
'BidiControl',
'scf',
'SimpleCaseFolding',
'na1',
'Unicode1Name',
'compex',
'FullCompositionExclusion',
'ext',
'Extender',
'cf',
'CaseFolding',
'grlink',
'GraphemeLink',
'xonfc',
'ExpandsOnNFC',
'sd',
'SoftDotted',
'ccc',
'CanonicalCombiningClass',
'dash',
'Dash',
'hex',
'HexDigit',
'grbase',
'GraphemeBase',
'dt',
'DecompositionType',
'xonfd',
'ExpandsOnNFD',
'idsb',
'IDSBinaryOperator',
'age',
'Age',
'loe',
'LogicalOrderException',
'term',
'TerminalPunctuation',
'ce',
'CompositionExclusion',
'isc',
'ISOComment',
'dep',
'Deprecated',
'bc',
'BidiClass',
'nchar',
'NoncharacterCodePoint',
'jt',
'JoiningType',
'upper',
'Uppercase',
'uideo',
'UnifiedIdeograph',
'sterm',
'STerm',
'nfkdqc',
'NFKDQuickCheck',
'oids',
'OtherIDStart',
'joinc',
'JoinControl',
'urs',
'UnicodeRadicalStroke',
'nv',
'NumericValue',
'suc',
'SimpleUppercaseMapping',
'bmg',
'BidiMirroringGlyph',
'grext',
'GraphemeExtend',
'idc',
'IDContinue',
'vs',
'VariationSelector',
'omath',
'OtherMath',
'lc',
'LowercaseMapping',
'ogrext',
'OtherGraphemeExtend',
'jg',
'JoiningGroup',
);
%utf8::PA_reverse = (
'linebreak',
'lb',
'bidiclass',
'bc',
'terminalpunctuation',
'Term',
'expandsonnfkc',
'XONFKC',
'extender',
'Ext',
'simplecasefolding',
'scf',
'patternsyntax',
'PatSyn',
'sentencebreak',
'SB',
'numericvalue',
'nv',
'patternwhitespace',
'PatWS',
'softdotted',
'SD',
'logicalorderexception',
'LOE',
'idstart',
'IDS',
'generalcategory',
'gc',
'decompositiontype',
'dt',
'name',
'na',
'numerictype',
'nt',
'otherlowercase',
'OLower',
'joininggroup',
'jg',
'expandsonnfkd',
'XONFKD',
'deprecated',
'Dep',
'radical',
'Radical',
'idstrinaryoperator',
'IDST',
'xidstart',
'XIDS',
'lowercase',
'Lower',
'unifiedideograph',
'UIdeo',
'othergraphemeextend',
'OGrExt',
'jamoshortname',
'JSN',
'eastasianwidth',
'ea',
'math',
'Math',
'graphemelink',
'GrLink',
'noncharactercodepoint',
'NChar',
'graphemebase',
'GrBase',
'bidimirrored',
'BidiM',
'casefolding',
'cf',
'simpleuppercasemapping',
'suc',
'fullcompositionexclusion',
'CompEx',
'compositionexclusion',
'CE',
'uppercasemapping',
'uc',
'decompositionmapping',
'dm',
'whitespace',
'WSpace',
'hyphen',
'Hyphen',
'ideographic',
'Ideo',
'idcontinue',
'IDC',
'idsbinaryoperator',
'IDSB',
'hangulsyllabletype',
'hst',
'asciihexdigit',
'AHex',
'otheruppercase',
'OUpper',
'nfkdquickcheck',
'NFKDQC',
'simpletitlecasemapping',
'stc',
'nfcquickcheck',
'NFCQC',
'bidicontrol',
'BidiC',
'diacritic',
'Dia',
'joiningtype',
'jt',
'otheralphabetic',
'OAlpha',
'canonicalcombiningclass',
'ccc',
'alphabetic',
'Alpha',
'titlecasemapping',
'tc',
'unicoderadicalstroke',
'URS',
'hexdigit',
'Hex',
'unicode1name',
'na1',
'dash',
'Dash',
'fcnfkcclosure',
'FCNFKC',
'graphemeextend',
'GrExt',
'joincontrol',
'JoinC',
'xidcontinue',
'XIDC',
'quotationmark',
'QMark',
'expandsonnfd',
'XONFD',
'age',
'age',
'otheridcontinue',
'OIDC',
'uppercase',
'Upper',
'expandsonnfc',
'XONFC',
'defaultignorablecodepoint',
'DI',
'nfdquickcheck',
'NFDQC',
'isocomment',
'isc',
'otherdefaultignorablecodepoint',
'ODI',
'variationselector',
'VS',
'script',
'sc',
'otheridstart',
'OIDS',
'sterm',
'STerm',
'graphemeclusterbreak',
'GCB',
'nfkcquickcheck',
'NFKCQC',
'bidimirroringglyph',
'bmg',
'othermath',
'OMath',
'block',
'blk',
'wordbreak',
'WB',
'lowercasemapping',
'lc',
'simplelowercasemapping',
'slc',
);
%utf8::PropValueAlias = (
'sc',
{
'runr',
'Runic',
'osma',
'Osmanya',
'hano',
'Hanunoo',
'cans',
'CanadianAboriginal',
'knda',
'Kannada',
'vaii',
'Vai',
'phnx',
'Phoenician',
'orya',
'Oriya',
'cher',
'Cherokee',
'khmr',
'Khmer',
'ogam',
'Ogham',
'saur',
'Saurashtra',
'cham',
'Cham',
'ital',
'OldItalic',
'tibt',
'Tibetan',
'lydi',
'Lydian',
'kana',
'Katakana',
'lepc',
'Lepcha',
'gujr',
'Gujarati',
'thaa',
'Thaana',
'copt',
'Coptic',
'sylo',
'SylotiNagri',
'talu',
'NewTaiLue',
'laoo',
'Lao',
'sinh',
'Sinhala',
'hira',
'Hiragana',
'cari',
'Carian',
'limb',
'Limbu',
'mymr',
'Myanmar',
'yiii',
'Yi',
'arab',
'Arabic',
'deva',
'Devanagari',
'xpeo',
'OldPersian',
'cprt',
'Cypriot',
'bugi',
'Buginese',
'hebr',
'Hebrew',
'tglg',
'Tagalog',
'sund',
'Sundanese',
'mlym',
'Malayalam',
'tagb',
'Tagbanwa',
'grek',
'Greek',
'ethi',
'Ethiopic',
'phag',
'PhagsPa',
'mong',
'Mongolian',
'hrkt',
'KatakanaOrHiragana',
'armn',
'Armenian',
'hani',
'Han',
'shaw',
'Shavian',
'taml',
'Tamil',
'guru',
'Gurmukhi',
'xsux',
'Cuneiform',
'ugar',
'Ugaritic',
'qaai',
'Inherited',
'cyrl',
'Cyrillic',
'thai',
'Thai',
'zzzz',
'Unknown',
'olck',
'OlChiki',
'beng',
'Bengali',
'bali',
'Balinese',
'kali',
'KayahLi',
'brai',
'Braille',
'telu',
'Telugu',
'geor',
'Georgian',
'hang',
'Hangul',
'glag',
'Glagolitic',
'syrc',
'Syriac',
'tfng',
'Tifinagh',
'dsrt',
'Deseret',
'buhd',
'Buhid',
'bopo',
'Bopomofo',
'khar',
'Kharoshthi',
'linb',
'LinearB',
'goth',
'Gothic',
'lyci',
'Lycian',
'rjng',
'Rejang',
'tale',
'TaiLe',
'zyyy',
'Common',
'latn',
'Latin',
'nkoo',
'Nko',
},
'JSN',
{
'gg',
'GG',
'lm',
'LM',
'a',
'A',
'ya',
'YA',
'd',
'D',
'yae',
'YAE',
'nh',
'NH',
'lp',
'LP',
'j',
'J',
'u',
'U',
'jj',
'JJ',
'ss',
'SS',
'k',
'K',
'g',
'G',
'bb',
'BB',
'lb',
'LB',
't',
'T',
'e',
'E',
'dd',
'DD',
's',
'S',
'lt',
'LT',
'c',
'C',
'gs',
'GS',
'b',
'B',
'nj',
'NJ',
'lh',
'LH',
'yi',
'YI',
'weo',
'WEO',
'r',
'R',
'ls',
'LS',
'we',
'WE',
'bs',
'BS',
'lg',
'LG',
'yo',
'YO',
'oe',
'OE',
'h',
'H',
'yu',
'YU',
'wi',
'WI',
'eu',
'EU',
'wa',
'WA',
'i',
'I',
'n',
'N',
'ye',
'YE',
'eo',
'EO',
'm',
'M',
'yeo',
'YEO',
'l',
'L',
'p',
'P',
'ng',
'NG',
'wae',
'WAE',
'ae',
'AE',
'o',
'O',
},
'Pat_Syn',
{
'y',
'Yes',
'n',
'No',
},
'IDS',
{
'y',
'Yes',
'n',
'No',
},
'Dep',
{
'y',
'Yes',
'n',
'No',
},
'OUpper',
{
'y',
'Yes',
'n',
'No',
},
'OAlpha',
{
'y',
'Yes',
'n',
'No',
},
'Lower',
{
'y',
'Yes',
'n',
'No',
},
'GCB',
{
'cn',
'Control',
'ex',
'Extend',
'v',
'V',
'pp',
'Prepend',
'lv',
'LV',
'xx',
'Other',
'sm',
'SpacingMark',
'l',
'L',
'lvt',
'LVT',
'cr',
'CR',
'lf',
'LF',
't',
'T',
},
'lb',
{
'sp',
'Space',
'ba',
'BreakAfter',
'gl',
'Glue',
'xx',
'Unknown',
'nu',
'Numeric',
'cb',
'ContingentBreak',
'sy',
'BreakSymbols',
'cr',
'CarriageReturn',
'in',
'Inseparable',
'bb',
'BreakBefore',
'sg',
'Surrogate',
'sa',
'ComplexContext',
'po',
'PostfixNumeric',
'jl',
'JL',
'id',
'Ideographic',
'al',
'Alphabetic',
'bk',
'MandatoryBreak',
'pr',
'PrefixNumeric',
'b2',
'BreakBoth',
'op',
'OpenPunctuation',
'cl',
'ClosePunctuation',
'is',
'InfixNumeric',
'qu',
'Quotation',
'hy',
'Hyphen',
'wj',
'WordJoiner',
'zw',
'ZWSpace',
'jt',
'JT',
'ex',
'Exclamation',
'cm',
'CombiningMark',
'h2',
'H2',
'nl',
'NextLine',
'ns',
'Nonstarter',
'h3',
'H3',
'ai',
'Ambiguous',
'lf',
'LineFeed',
'jv',
'JV',
},
'AHex',
{
'y',
'Yes',
'n',
'No',
},
'DI',
{
'y',
'Yes',
'n',
'No',
},
'OLower',
{
'y',
'Yes',
'n',
'No',
},
'CE',
{
'y',
'Yes',
'n',
'No',
},
'XO_NFKC',
{
'y',
'Yes',
'n',
'No',
},
'LOE',
{
'y',
'Yes',
'n',
'No',
},
'WSpace',
{
'y',
'Yes',
'n',
'No',
},
'XO_NFC',
{
'y',
'Yes',
'n',
'No',
},
'Bidi_M',
{
'y',
'Yes',
'n',
'No',
},
'XIDC',
{
'y',
'Yes',
'n',
'No',
},
'Radical',
{
'y',
'Yes',
'n',
'No',
},
'Alpha',
{
'y',
'Yes',
'n',
'No',
},
'STerm',
{
'y',
'Yes',
'n',
'No',
},
'nt',
{
'none',
'None',
'di',
'Digit',
'de',
'Decimal',
'nu',
'Numeric',
},
'ea',
{
'w',
'Wide',
'n',
'Neutral',
'h',
'Halfwidth',
'a',
'Ambiguous',
'f',
'Fullwidth',
'na',
'Narrow',
},
'Ext',
{
'y',
'Yes',
'n',
'No',
},
'XO_NFD',
{
'y',
'Yes',
'n',
'No',
},
'OMath',
{
'y',
'Yes',
'n',
'No',
},
'ODI',
{
'y',
'Yes',
'n',
'No',
},
'gc',
{
'sc',
'CurrencySymbol',
'mc',
'SpacingMark',
'lm',
'ModifierLetter',
'cn',
'Unassigned',
'pf',
'FinalPunctuation',
'no',
'OtherNumber',
'cc',
'Control',
'lo',
'OtherLetter',
'po',
'OtherPunctuation',
'zs',
'SpaceSeparator',
'co',
'PrivateUse',
'so',
'OtherSymbol',
'll',
'LowercaseLetter',
'nd',
'DecimalNumber',
'cf',
'Format',
'me',
'EnclosingMark',
's',
'Symbol',
'zp',
'ParagraphSeparator',
'pd',
'DashPunctuation',
'c',
'Other',
'lt',
'TitlecaseLetter',
'cs',
'Surrogate',
'l&',
'CasedLetter',
'z',
'Separator',
'ps',
'OpenPunctuation',
'zl',
'LineSeparator',
'pc',
'ConnectorPunctuation',
'pi',
'InitialPunctuation',
'n',
'Number',
'm',
'Mark',
'nl',
'LetterNumber',
'sm',
'MathSymbol',
'l',
'Letter',
'mn',
'NonspacingMark',
'p',
'Punctuation',
'lc',
'CasedLetter',
'sk',
'ModifierSymbol',
'lu',
'UppercaseLetter',
'pe',
'ClosePunctuation',
},
'IDSB',
{
'y',
'Yes',
'n',
'No',
},
'NChar',
{
'y',
'Yes',
'n',
'No',
},
'UIdeo',
{
'y',
'Yes',
'n',
'No',
},
'Term',
{
'y',
'Yes',
'n',
'No',
},
'QMark',
{
'y',
'Yes',
'n',
'No',
},
'Hyphen',
{
'y',
'Yes',
'n',
'No',
},
'XIDS',
{
'y',
'Yes',
'n',
'No',
},
'NFC_QC',
{
'y',
'Yes',
'n',
'No',
'm',
'Maybe',
},
'Dia',
{
'y',
'Yes',
'n',
'No',
},
'Bidi_C',
{
'y',
'Yes',
'n',
'No',
},
'hst',
{
'l',
'LeadingJamo',
'lvt',
'LVTSyllable',
'v',
'VowelJamo',
'lv',
'LVSyllable',
't',
'TrailingJamo',
'na',
'NotApplicable',
},
'WB',
{
'extend',
'Extend',
'ml',
'MidLetter',
'mb',
'MidNumLet',
'le',
'ALetter',
'ex',
'ExtendNumLet',
'xx',
'Other',
'nu',
'Numeric',
'nl',
'Newline',
'mn',
'MidNum',
'fo',
'Format',
'cr',
'CR',
'ka',
'Katakana',
'lf',
'LF',
},
'Math',
{
'y',
'Yes',
'n',
'No',
},
'Pat_WS',
{
'y',
'Yes',
'n',
'No',
},
'SD',
{
'y',
'Yes',
'n',
'No',
},
'Upper',
{
'y',
'Yes',
'n',
'No',
},
'OIDC',
{
'y',
'Yes',
'n',
'No',
},
'IDST',
{
'y',
'Yes',
'n',
'No',
},
'Gr_Ext',
{
'y',
'Yes',
'n',
'No',
},
'Comp_Ex',
{
'y',
'Yes',
'n',
'No',
},
'NFD_QC',
{
'y',
'Yes',
'n',
'No',
},
'VS',
{
'y',
'Yes',
'n',
'No',
},
'Join_C',
{
'y',
'Yes',
'n',
'No',
},
'ccc',
{
'atb',
'AttachedBelow',
'db',
'DoubleBelow',
'a',
'Above',
'r',
'Right',
'da',
'DoubleAbove',
'is',
'IotaSubscript',
'nr',
'NotReordered',
'ov',
'Overlay',
'br',
'BelowRight',
'nk',
'Nukta',
'atbl',
'AttachedBelowLeft',
'al',
'AboveLeft',
'ar',
'AboveRight',
'atar',
'AttachedAboveRight',
'l',
'Left',
'b',
'Below',
'vr',
'Virama',
'kv',
'KanaVoicing',
'bl',
'BelowLeft',
},
'dt',
{
'fra',
'Fraction',
'none',
'none',
'sml',
'Small',
'enc',
'Circle',
'font',
'font',
'init',
'Initial',
'nb',
'Nobreak',
'iso',
'Isolated',
'sup',
'Super',
'fin',
'Final',
'wide',
'wide',
'nar',
'Narrow',
'can',
'Canonical',
'med',
'Medial',
'sub',
'sub',
'vert',
'Vertical',
'sqr',
'Square',
'com',
'Compat',
},
'Ideo',
{
'y',
'Yes',
'n',
'No',
},
'Gr_Link',
{
'y',
'Yes',
'n',
'No',
},
'OGr_Ext',
{
'y',
'Yes',
'n',
'No',
},
'XO_NFKD',
{
'y',
'Yes',
'n',
'No',
},
'NFKC_QC',
{
'y',
'Yes',
'n',
'No',
'm',
'Maybe',
},
'bc',
{
'r',
'RightToLeft',
'rlo',
'RightToLeftOverride',
'es',
'EuropeanSeparator',
'ws',
'WhiteSpace',
'rle',
'RightToLeftEmbedding',
'on',
'OtherNeutral',
'bn',
'BoundaryNeutral',
'et',
'EuropeanTerminator',
'pdf',
'PopDirectionalFormat',
'lro',
'LeftToRightOverride',
's',
'SegmentSeparator',
'al',
'ArabicLetter',
'en',
'EuropeanNumber',
'l',
'LeftToRight',
'b',
'ParagraphSeparator',
'lre',
'LeftToRightEmbedding',
'cs',
'CommonSeparator',
'nsm',
'NonspacingMark',
'an',
'ArabicNumber',
},
'Dash',
{
'y',
'Yes',
'n',
'No',
},
'jt',
{
'l',
'LeftJoining',
'u',
'NonJoining',
'c',
'JoinCausing',
'r',
'RightJoining',
'd',
'DualJoining',
't',
'Transparent',
},
'NFKD_QC',
{
'y',
'Yes',
'n',
'No',
},
'IDC',
{
'y',
'Yes',
'n',
'No',
},
'OIDS',
{
'y',
'Yes',
'n',
'No',
},
'Gr_Base',
{
'y',
'Yes',
'n',
'No',
},
'Hex',
{
'y',
'Yes',
'n',
'No',
},
'SB',
{
'sp',
'Sp',
'sc',
'SContinue',
'cl',
'Close',
'le',
'OLetter',
'ex',
'Extend',
'up',
'Upper',
'st',
'STerm',
'xx',
'Other',
'nu',
'Numeric',
'fo',
'Format',
'cr',
'CR',
'se',
'Sep',
'lo',
'Lower',
'at',
'ATerm',
'lf',
'LF',
},
);
%utf8::PVA_reverse = (
'sc',
{
'newtailue',
'Talu',
'kayahli',
'Kali',
'hebrew',
'Hebr',
'phoenician',
'Phnx',
'linearb',
'Linb',
'cham',
'Cham',
'ugaritic',
'Ugar',
'sundanese',
'Sund',
'armenian',
'Armn',
'myanmar',
'Mymr',
'gurmukhi',
'Guru',
'greek',
'Grek',
'coptic',
'Copt',
'thaana',
'Thaa',
'katakana',
'Kana',
'tibetan',
'Tibt',
'mongolian',
'Mong',
'malayalam',
'Mlym',
'oriya',
'Orya',
'carian',
'Cari',
'buhid',
'Buhd',
'cypriot',
'Cprt',
'bengali',
'Beng',
'katakanaorhiragana',
'Hrkt',
'oldpersian',
'Xpeo',
'tagalog',
'Tglg',
'cherokee',
'Cher',
'ogham',
'Ogam',
'common',
'Zyyy',
'saurashtra',
'Saur',
'vai',
'Vaii',
'ethiopic',
'Ethi',
'han',
'Hani',
'lydian',
'Lydi',
'gothic',
'Goth',
'osmanya',
'Osma',
'devanagari',
'Deva',
'buginese',
'Bugi',
'canadianaboriginal',
'Cans',
'gujarati',
'Gujr',
'latin',
'Latn',
'rejang',
'Rjng',
'hangul',
'Hang',
'deseret',
'Dsrt',
'olchiki',
'Olck',
'inherited',
'Qaai',
'taile',
'Tale',
'tifinagh',
'Tfng',
'cyrillic',
'Cyrl',
'lao',
'Laoo',
'khmer',
'Khmr',
'balinese',
'Bali',
'hiragana',
'Hira',
'lepcha',
'Lepc',
'thai',
'Thai',
'yi',
'Yiii',
'sylotinagri',
'Sylo',
'bopomofo',
'Bopo',
'telugu',
'Telu',
'limbu',
'Limb',
'cuneiform',
'Xsux',
'unknown',
'Zzzz',
'syriac',
'Syrc',
'hanunoo',
'Hano',
'braille',
'Brai',
'tamil',
'Taml',
'lycian',
'Lyci',
'nko',
'Nkoo',
'runic',
'Runr',
'glagolitic',
'Glag',
'georgian',
'Geor',
'kharoshthi',
'Khar',
'kannada',
'Knda',
'arabic',
'Arab',
'tagbanwa',
'Tagb',
'sinhala',
'Sinh',
'olditalic',
'Ital',
'phagspa',
'Phag',
'shavian',
'Shaw',
},
'JSN',
{
'gg',
'GG',
'lm',
'LM',
'a',
'A',
'ya',
'YA',
'd',
'D',
'yae',
'YAE',
'nh',
'NH',
'lp',
'LP',
'j',
'J',
'u',
'U',
'jj',
'JJ',
'ss',
'SS',
'k',
'K',
'g',
'G',
'bb',
'BB',
'lb',
'LB',
't',
'T',
'e',
'E',
'dd',
'DD',
's',
'S',
'lt',
'LT',
'c',
'C',
'gs',
'GS',
'b',
'B',
'nj',
'NJ',
'lh',
'LH',
'yi',
'YI',
'weo',
'WEO',
'r',
'R',
'ls',
'LS',
'we',
'WE',
'bs',
'BS',
'lg',
'LG',
'yo',
'YO',
'oe',
'OE',
'h',
'H',
'yu',
'YU',
'wi',
'WI',
'eu',
'EU',
'wa',
'WA',
'i',
'I',
'n',
'N',
'ye',
'YE',
'eo',
'EO',
'm',
'M',
'yeo',
'YEO',
'l',
'L',
'p',
'P',
'ng',
'NG',
'wae',
'WAE',
'ae',
'AE',
'o',
'O',
},
'Pat_Syn',
{
'yes',
'Y',
'no',
'N',
},
'IDS',
{
'yes',
'Y',
'no',
'N',
},
'Dep',
{
'yes',
'Y',
'no',
'N',
},
'OUpper',
{
'yes',
'Y',
'no',
'N',
},
'OAlpha',
{
'yes',
'Y',
'no',
'N',
},
'Lower',
{
'yes',
'Y',
'no',
'N',
},
'GCB',
{
'extend',
'EX',
'spacingmark',
'SM',
'v',
'V',
'prepend',
'PP',
'lv',
'LV',
'l',
'L',
'lvt',
'LVT',
'cr',
'CR',
'other',
'XX',
'lf',
'LF',
't',
'T',
'control',
'CN',
},
'lb',
{
'carriagereturn',
'CR',
'ideographic',
'ID',
'hyphen',
'HY',
'ambiguous',
'AI',
'contingentbreak',
'CB',
'complexcontext',
'SA',
'prefixnumeric',
'PR',
'jl',
'JL',
'inseparable',
'IN',
'breaksymbols',
'SY',
'breakafter',
'BA',
'breakbefore',
'BB',
'postfixnumeric',
'PO',
'glue',
'GL',
'wordjoiner',
'WJ',
'breakboth',
'B2',
'quotation',
'QU',
'combiningmark',
'CM',
'nonstarter',
'NS',
'linefeed',
'LF',
'alphabetic',
'AL',
'surrogate',
'SG',
'mandatorybreak',
'BK',
'unknown',
'XX',
'exclamation',
'EX',
'openpunctuation',
'OP',
'jt',
'JT',
'closepunctuation',
'CL',
'space',
'SP',
'zwspace',
'ZW',
'h2',
'H2',
'infixnumeric',
'IS',
'nextline',
'NL',
'numeric',
'NU',
'h3',
'H3',
'jv',
'JV',
},
'AHex',
{
'yes',
'Y',
'no',
'N',
},
'DI',
{
'yes',
'Y',
'no',
'N',
},
'OLower',
{
'yes',
'Y',
'no',
'N',
},
'CE',
{
'yes',
'Y',
'no',
'N',
},
'XO_NFKC',
{
'yes',
'Y',
'no',
'N',
},
'LOE',
{
'yes',
'Y',
'no',
'N',
},
'WSpace',
{
'yes',
'Y',
'no',
'N',
},
'XO_NFC',
{
'yes',
'Y',
'no',
'N',
},
'Bidi_M',
{
'yes',
'Y',
'no',
'N',
},
'XIDC',
{
'yes',
'Y',
'no',
'N',
},
'Radical',
{
'yes',
'Y',
'no',
'N',
},
'Alpha',
{
'yes',
'Y',
'no',
'N',
},
'STerm',
{
'yes',
'Y',
'no',
'N',
},
'nt',
{
'none',
'None',
'digit',
'Di',
'numeric',
'Nu',
'decimal',
'De',
},
'ea',
{
'halfwidth',
'H',
'fullwidth',
'F',
'ambiguous',
'A',
'narrow',
'Na',
'wide',
'W',
'neutral',
'N',
},
'Ext',
{
'yes',
'Y',
'no',
'N',
},
'XO_NFD',
{
'yes',
'Y',
'no',
'N',
},
'OMath',
{
'yes',
'Y',
'no',
'N',
},
'ODI',
{
'yes',
'Y',
'no',
'N',
},
'gc',
{
'modifiersymbol',
'Sk',
'letternumber',
'Nl',
'connectorpunctuation',
'Pc',
'spacingmark',
'Mc',
'mark',
'M',
'unassigned',
'Cn',
'enclosingmark',
'Me',
'lineseparator',
'Zl',
'lowercaseletter',
'Ll',
'symbol',
'S',
'letter',
'L',
'othernumber',
'No',
'paragraphseparator',
'Zp',
'modifierletter',
'Lm',
'titlecaseletter',
'Lt',
'decimalnumber',
'Nd',
'other',
'C',
'mathsymbol',
'Sm',
'surrogate',
'Cs',
'otherletter',
'Lo',
'nonspacingmark',
'Mn',
'number',
'N',
'uppercaseletter',
'Lu',
'spaceseparator',
'Zs',
'privateuse',
'Co',
'openpunctuation',
'Ps',
'punctuation',
'P',
'control',
'Cc',
'casedletter',
'LC',
'closepunctuation',
'Pe',
'otherpunctuation',
'Po',
'finalpunctuation',
'Pf',
'format',
'Cf',
'initialpunctuation',
'Pi',
'separator',
'Z',
'othersymbol',
'So',
'dashpunctuation',
'Pd',
'currencysymbol',
'Sc',
},
'IDSB',
{
'yes',
'Y',
'no',
'N',
},
'NChar',
{
'yes',
'Y',
'no',
'N',
},
'UIdeo',
{
'yes',
'Y',
'no',
'N',
},
'Term',
{
'yes',
'Y',
'no',
'N',
},
'QMark',
{
'yes',
'Y',
'no',
'N',
},
'Hyphen',
{
'yes',
'Y',
'no',
'N',
},
'XIDS',
{
'yes',
'Y',
'no',
'N',
},
'NFC_QC',
{
'yes',
'Y',
'maybe',
'M',
'no',
'N',
},
'Dia',
{
'yes',
'Y',
'no',
'N',
},
'Bidi_C',
{
'yes',
'Y',
'no',
'N',
},
'hst',
{
'lvtsyllable',
'LVT',
'lvsyllable',
'LV',
'leadingjamo',
'L',
'notapplicable',
'NA',
'voweljamo',
'V',
'trailingjamo',
'T',
},
'WB',
{
'extend',
'Extend',
'midletter',
'ML',
'midnumlet',
'MB',
'cr',
'CR',
'format',
'FO',
'katakana',
'KA',
'other',
'XX',
'numeric',
'NU',
'midnum',
'MN',
'extendnumlet',
'EX',
'lf',
'LF',
'newline',
'NL',
'aletter',
'LE',
},
'Math',
{
'yes',
'Y',
'no',
'N',
},
'Pat_WS',
{
'yes',
'Y',
'no',
'N',
},
'SD',
{
'yes',
'Y',
'no',
'N',
},
'Upper',
{
'yes',
'Y',
'no',
'N',
},
'OIDC',
{
'yes',
'Y',
'no',
'N',
},
'IDST',
{
'yes',
'Y',
'no',
'N',
},
'Gr_Ext',
{
'yes',
'Y',
'no',
'N',
},
'Comp_Ex',
{
'yes',
'Y',
'no',
'N',
},
'NFD_QC',
{
'yes',
'Y',
'no',
'N',
},
'VS',
{
'yes',
'Y',
'no',
'N',
},
'Join_C',
{
'yes',
'Y',
'no',
'N',
},
'ccc',
{
'left',
'L',
'attachedbelowleft',
'ATBL',
'belowleft',
'BL',
'aboveright',
'AR',
'kanavoicing',
'KV',
'above',
'A',
'aboveleft',
'AL',
'nukta',
'NK',
'below',
'B',
'doublebelow',
'DB',
'virama',
'VR',
'belowright',
'BR',
'notreordered',
'NR',
'attachedbelow',
'ATB',
'right',
'R',
'iotasubscript',
'IS',
'doubleabove',
'DA',
'attachedaboveright',
'ATAR',
'overlay',
'OV',
},
'dt',
{
'small',
'Sml',
'none',
'None',
'isolated',
'Iso',
'narrow',
'Nar',
'square',
'Sqr',
'nobreak',
'Nb',
'fraction',
'Fra',
'font',
'Font',
'medial',
'Med',
'wide',
'Wide',
'canonical',
'Can',
'circle',
'Enc',
'super',
'Sup',
'vertical',
'Vert',
'final',
'Fin',
'compat',
'Com',
'sub',
'Sub',
'initial',
'Init',
},
'Ideo',
{
'yes',
'Y',
'no',
'N',
},
'Gr_Link',
{
'yes',
'Y',
'no',
'N',
},
'OGr_Ext',
{
'yes',
'Y',
'no',
'N',
},
'XO_NFKD',
{
'yes',
'Y',
'no',
'N',
},
'NFKC_QC',
{
'yes',
'Y',
'maybe',
'M',
'no',
'N',
},
'bc',
{
'nonspacingmark',
'NSM',
'whitespace',
'WS',
'righttoleft',
'R',
'lefttoright',
'L',
'boundaryneutral',
'BN',
'segmentseparator',
'S',
'lefttorightembedding',
'LRE',
'europeanterminator',
'ET',
'righttoleftembedding',
'RLE',
'righttoleftoverride',
'RLO',
'lefttorightoverride',
'LRO',
'europeanseparator',
'ES',
'europeannumber',
'EN',
'commonseparator',
'CS',
'arabicletter',
'AL',
'paragraphseparator',
'B',
'otherneutral',
'ON',
'popdirectionalformat',
'PDF',
'arabicnumber',
'AN',
},
'Dash',
{
'yes',
'Y',
'no',
'N',
},
'jt',
{
'leftjoining',
'L',
'transparent',
'T',
'nonjoining',
'U',
'rightjoining',
'R',
'dualjoining',
'D',
'joincausing',
'C',
},
'NFKD_QC',
{
'yes',
'Y',
'no',
'N',
},
'IDC',
{
'yes',
'Y',
'no',
'N',
},
'OIDS',
{
'yes',
'Y',
'no',
'N',
},
'Gr_Base',
{
'yes',
'Y',
'no',
'N',
},
'Hex',
{
'yes',
'Y',
'no',
'N',
},
'SB',
{
'sp',
'SP',
'extend',
'EX',
'upper',
'UP',
'sterm',
'ST',
'scontinue',
'SC',
'aterm',
'AT',
'close',
'CL',
'oletter',
'LE',
'sep',
'SE',
'cr',
'CR',
'format',
'FO',
'other',
'XX',
'lower',
'LO',
'numeric',
'NU',
'lf',
'LF',
},
);
%utf8::PVA_abbr_map = (
'JSN',
{
'gg',
'GG',
'lm',
'LM',
'a',
'A',
'ya',
'YA',
'd',
'D',
'yae',
'YAE',
'nh',
'NH',
'lp',
'LP',
'j',
'J',
'u',
'U',
'jj',
'JJ',
'ss',
'SS',
'k',
'K',
'g',
'G',
'bb',
'BB',
'lb',
'LB',
't',
'T',
'e',
'E',
'dd',
'DD',
's',
'S',
'lt',
'LT',
'c',
'C',
'gs',
'GS',
'b',
'B',
'nj',
'NJ',
'lh',
'LH',
'yi',
'YI',
'weo',
'WEO',
'r',
'R',
'ls',
'LS',
'we',
'WE',
'bs',
'BS',
'lg',
'LG',
'yo',
'YO',
'oe',
'OE',
'h',
'H',
'yu',
'YU',
'wi',
'WI',
'eu',
'EU',
'wa',
'WA',
'i',
'I',
'n',
'N',
'ye',
'YE',
'eo',
'EO',
'm',
'M',
'yeo',
'YEO',
'l',
'L',
'p',
'P',
'ng',
'NG',
'wae',
'WAE',
'ae',
'AE',
'o',
'O',
},
'Pat_Syn',
{
'y',
'Y',
'n',
'N',
},
'IDS',
{
'y',
'Y',
'n',
'N',
},
'gc_sc',
{
'runr',
'Runr',
'osma',
'Osma',
'sc',
'Sc',
'mc',
'Mc',
'hano',
'Hano',
'cans',
'Cans',
'lm',
'Lm',
'cn',
'Cn',
'knda',
'Knda',
'vaii',
'Vaii',
'phnx',
'Phnx',
'orya',
'Orya',
'cher',
'Cher',
'khmr',
'Khmr',
'ogam',
'Ogam',
'lo',
'Lo',
'saur',
'Saur',
'po',
'Po',
'cham',
'Cham',
'co',
'Co',
'ital',
'Ital',
'll',
'Ll',
'tibt',
'Tibt',
'lydi',
'Lydi',
'kana',
'Kana',
'zp',
'Zp',
'lepc',
'Lepc',
'gujr',
'Gujr',
'thaa',
'Thaa',
'cs',
'Cs',
'copt',
'Copt',
'z',
'Z',
'ps',
'Ps',
'sylo',
'Sylo',
'talu',
'Talu',
'laoo',
'Laoo',
'sinh',
'Sinh',
'zl',
'Zl',
'pc',
'Pc',
'hira',
'Hira',
'cari',
'Cari',
'limb',
'Limb',
'mymr',
'Mymr',
'yiii',
'Yiii',
'arab',
'Arab',
'deva',
'Deva',
'xpeo',
'Xpeo',
'cprt',
'Cprt',
'bugi',
'Bugi',
'sk',
'Sk',
'hebr',
'Hebr',
'lu',
'Lu',
'pe',
'Pe',
'tglg',
'Tglg',
'sund',
'Sund',
'tagb',
'Tagb',
'mlym',
'Mlym',
'pf',
'Pf',
'no',
'No',
'grek',
'Grek',
'ethi',
'Ethi',
'phag',
'Phag',
'mong',
'Mong',
'cc',
'Cc',
'hrkt',
'Hrkt',
'armn',
'Armn',
'zs',
'Zs',
'so',
'So',
'hani',
'Hani',
'shaw',
'Shaw',
'taml',
'Taml',
'me',
'Me',
'cf',
'Cf',
'nd',
'Nd',
's',
'S',
'guru',
'Guru',
'xsux',
'Xsux',
'ugar',
'Ugar',
'qaai',
'Qaai',
'lt',
'Lt',
'c',
'C',
'pd',
'Pd',
'cyrl',
'Cyrl',
'l&',
'LC',
'thai',
'Thai',
'zzzz',
'Zzzz',
'olck',
'Olck',
'beng',
'Beng',
'bali',
'Bali',
'kali',
'Kali',
'brai',
'Brai',
'telu',
'Telu',
'pi',
'Pi',
'geor',
'Geor',
'glag',
'Glag',
'hang',
'Hang',
'syrc',
'Syrc',
'tfng',
'Tfng',
'n',
'N',
'dsrt',
'Dsrt',
'buhd',
'Buhd',
'm',
'M',
'khar',
'Khar',
'sm',
'Sm',
'nl',
'Nl',
'bopo',
'Bopo',
'linb',
'Linb',
'mn',
'Mn',
'l',
'L',
'lyci',
'Lyci',
'p',
'P',
'goth',
'Goth',
'rjng',
'Rjng',
'tale',
'Tale',
'lc',
'LC',
'zyyy',
'Zyyy',
'latn',
'Latn',
'nkoo',
'Nkoo',
},
'Dep',
{
'y',
'Y',
'n',
'N',
},
'OUpper',
{
'y',
'Y',
'n',
'N',
},
'OAlpha',
{
'y',
'Y',
'n',
'N',
},
'Lower',
{
'y',
'Y',
'n',
'N',
},
'GCB',
{
'cn',
'CN',
'ex',
'EX',
'v',
'V',
'pp',
'PP',
'lv',
'LV',
'xx',
'XX',
'sm',
'SM',
'l',
'L',
'lvt',
'LVT',
'cr',
'CR',
'lf',
'LF',
't',
'T',
},
'lb',
{
'sp',
'SP',
'ba',
'BA',
'gl',
'GL',
'xx',
'XX',
'nu',
'NU',
'cb',
'CB',
'sy',
'SY',
'cr',
'CR',
'in',
'IN',
'bb',
'BB',
'sg',
'SG',
'sa',
'SA',
'po',
'PO',
'jl',
'JL',
'id',
'ID',
'al',
'AL',
'bk',
'BK',
'pr',
'PR',
'b2',
'B2',
'op',
'OP',
'cl',
'CL',
'is',
'IS',
'qu',
'QU',
'hy',
'HY',
'wj',
'WJ',
'zw',
'ZW',
'jt',
'JT',
'ex',
'EX',
'cm',
'CM',
'h2',
'H2',
'nl',
'NL',
'ns',
'NS',
'h3',
'H3',
'ai',
'AI',
'lf',
'LF',
'jv',
'JV',
},
'AHex',
{
'y',
'Y',
'n',
'N',
},
'DI',
{
'y',
'Y',
'n',
'N',
},
'OLower',
{
'y',
'Y',
'n',
'N',
},
'CE',
{
'y',
'Y',
'n',
'N',
},
'XO_NFKC',
{
'y',
'Y',
'n',
'N',
},
'LOE',
{
'y',
'Y',
'n',
'N',
},
'WSpace',
{
'y',
'Y',
'n',
'N',
},
'XO_NFC',
{
'y',
'Y',
'n',
'N',
},
'Bidi_M',
{
'y',
'Y',
'n',
'N',
},
'XIDC',
{
'y',
'Y',
'n',
'N',
},
'Radical',
{
'y',
'Y',
'n',
'N',
},
'Alpha',
{
'y',
'Y',
'n',
'N',
},
'STerm',
{
'y',
'Y',
'n',
'N',
},
'nt',
{
'none',
'None',
'di',
'Di',
'de',
'De',
'nu',
'Nu',
},
'ea',
{
'w',
'W',
'n',
'N',
'h',
'H',
'a',
'A',
'f',
'F',
'na',
'Na',
},
'Ext',
{
'y',
'Y',
'n',
'N',
},
'XO_NFD',
{
'y',
'Y',
'n',
'N',
},
'OMath',
{
'y',
'Y',
'n',
'N',
},
'ODI',
{
'y',
'Y',
'n',
'N',
},
'IDSB',
{
'y',
'Y',
'n',
'N',
},
'NChar',
{
'y',
'Y',
'n',
'N',
},
'UIdeo',
{
'y',
'Y',
'n',
'N',
},
'Term',
{
'y',
'Y',
'n',
'N',
},
'QMark',
{
'y',
'Y',
'n',
'N',
},
'Hyphen',
{
'y',
'Y',
'n',
'N',
},
'XIDS',
{
'y',
'Y',
'n',
'N',
},
'NFC_QC',
{
'y',
'Y',
'n',
'N',
'm',
'M',
},
'Dia',
{
'y',
'Y',
'n',
'N',
},
'Bidi_C',
{
'y',
'Y',
'n',
'N',
},
'hst',
{
'l',
'L',
'lvt',
'LVT',
'v',
'V',
'lv',
'LV',
't',
'T',
'na',
'NA',
},
'WB',
{
'extend',
'Extend',
'ml',
'ML',
'mb',
'MB',
'le',
'LE',
'ex',
'EX',
'xx',
'XX',
'nu',
'NU',
'nl',
'NL',
'mn',
'MN',
'fo',
'FO',
'cr',
'CR',
'ka',
'KA',
'lf',
'LF',
},
'Math',
{
'y',
'Y',
'n',
'N',
},
'Pat_WS',
{
'y',
'Y',
'n',
'N',
},
'SD',
{
'y',
'Y',
'n',
'N',
},
'Upper',
{
'y',
'Y',
'n',
'N',
},
'OIDC',
{
'y',
'Y',
'n',
'N',
},
'IDST',
{
'y',
'Y',
'n',
'N',
},
'Gr_Ext',
{
'y',
'Y',
'n',
'N',
},
'Comp_Ex',
{
'y',
'Y',
'n',
'N',
},
'NFD_QC',
{
'y',
'Y',
'n',
'N',
},
'VS',
{
'y',
'Y',
'n',
'N',
},
'Join_C',
{
'y',
'Y',
'n',
'N',
},
'ccc',
{
'atb',
'ATB',
'db',
'DB',
'a',
'A',
'r',
'R',
'da',
'DA',
'is',
'IS',
'nr',
'NR',
'ov',
'OV',
'br',
'BR',
'nk',
'NK',
'atbl',
'ATBL',
'al',
'AL',
'ar',
'AR',
'atar',
'ATAR',
'l',
'L',
'b',
'B',
'vr',
'VR',
'kv',
'KV',
'bl',
'BL',
},
'dt',
{
'fra',
'Fra',
'none',
'None',
'sml',
'Sml',
'enc',
'Enc',
'font',
'Font',
'init',
'Init',
'nb',
'Nb',
'iso',
'Iso',
'sup',
'Sup',
'fin',
'Fin',
'wide',
'Wide',
'nar',
'Nar',
'can',
'Can',
'med',
'Med',
'sub',
'Sub',
'vert',
'Vert',
'sqr',
'Sqr',
'com',
'Com',
},
'Ideo',
{
'y',
'Y',
'n',
'N',
},
'Gr_Link',
{
'y',
'Y',
'n',
'N',
},
'OGr_Ext',
{
'y',
'Y',
'n',
'N',
},
'XO_NFKD',
{
'y',
'Y',
'n',
'N',
},
'NFKC_QC',
{
'y',
'Y',
'n',
'N',
'm',
'M',
},
'bc',
{
'r',
'R',
'rlo',
'RLO',
'es',
'ES',
'ws',
'WS',
'rle',
'RLE',
'on',
'ON',
'bn',
'BN',
'et',
'ET',
'pdf',
'PDF',
'lro',
'LRO',
's',
'S',
'al',
'AL',
'en',
'EN',
'l',
'L',
'b',
'B',
'lre',
'LRE',
'cs',
'CS',
'nsm',
'NSM',
'an',
'AN',
},
'Dash',
{
'y',
'Y',
'n',
'N',
},
'jt',
{
'l',
'L',
'u',
'U',
'c',
'C',
'r',
'R',
'd',
'D',
't',
'T',
},
'NFKD_QC',
{
'y',
'Y',
'n',
'N',
},
'IDC',
{
'y',
'Y',
'n',
'N',
},
'OIDS',
{
'y',
'Y',
'n',
'N',
},
'Gr_Base',
{
'y',
'Y',
'n',
'N',
},
'Hex',
{
'y',
'Y',
'n',
'N',
},
'SB',
{
'sp',
'SP',
'sc',
'SC',
'cl',
'CL',
'le',
'LE',
'ex',
'EX',
'up',
'UP',
'st',
'ST',
'xx',
'XX',
'nu',
'NU',
'fo',
'FO',
'cr',
'CR',
'se',
'SE',
'lo',
'LO',
'at',
'AT',
'lf',
'LF',
},
);
1;
|