Make sure that full corpus passes #41

jenshnielsen · 2016-04-25T14:37:42Z

In sample corpus the following files currently fail:

sample_corpus/cmawro-01-01.atf  SyntaxError: PyOracc could not parse token 'LexToken(SCORELABEL,'A₁_obv_i_1′',1268,371)'
sample_corpus/SAA06_08.atf SyntaxError: PyOracc could not parse token 'LexToken(ID,'space',731,5705)' Fails to parse $ blank space of 3 lines in line 220 is that valid in strict mode?
sample_corpus/SAA10.atf SyntaxError: PyOracc got an illegal character '@' (fails to parse $@(r 1) (first line broken away) on line 13378

The text was updated successfully, but these errors were encountered:

jenshnielsen · 2016-04-25T14:49:29Z

Removed

jenshnielsen · 2016-04-25T15:36:29Z

Investigating cmawro-01-01.atf

import codecs
text = codecs.open('/Users/jhn/ucl/oracc/pyoracc/pyoracc/test/fixtures/sample_corpus/cmawro-01-01.atf', encoding='utf-8-sig').read()
from pyoracc.atf.atffile import AtfLexer
lexer = AtfLexer().lexer
lexer.input(text)
for tok in lexer:
    print(tok)

Fails in the translation at line 1151

@(1.5′)   You pound @lab{1′}[...]  ...  [...] @lab{2′}[...], 'sweet' [re]ed, @su@ād@u-plant, ... [...] @lab{3′}[...], @murdudû-plant, @ardalillu-plant, @lab{4′}[‘marsh’]-apple, @lal[@lagu-pea, ‘@?heals-a-thousand’-plant?@], @lab{5′}‘heals-twenty’-plant, (and) @?lupine?@. Then @lab{6′}[you @mi]x (it) in beer (and) emmer beer and wine. @lab{9′}You s[teep] (therein) @lab{7′}honey, ghee, @ruʾtītu-sulphur, @lab{8′}@imbuʾ @tâmti-mineral, gold, silver, iron, @lab{9′}carnelian, (and) lapis lazuli, (all of) them fresh. @lab{10′}You cover the [o]pening (of the vessel); @lab{11′}you set it out @lab{10′}during the night be[fore the @star(@s)] for six days. @lab{11′}On the seventh day, @lab{12′}you have him drink (the potion) @lab{11′}on an empty stomach, @lab{12′}and he will recover.

jenshnielsen · 2016-04-25T15:37:10Z

Seems like the @(1.5′) syntax is not supported

raquelalegre · 2016-04-25T16:41:18Z

Tried online validation agains ORACC server of the whole corpus, but the server broke after a few hundred tests, so it's not complete. These are the ones that failed (more info on each of them below):

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/ctn_4_010.atf
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/brm_4_06.atf
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/bb_2_005.atf
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/mul-apin.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu-maths.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_090.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_091.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_092.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_126.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_2_040.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_2_044.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_059.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_070.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_071.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_072.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_084.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_088.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_089.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_095.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_099.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_4_141.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_4_196.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_235.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_241.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_264.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_004.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_005.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_006.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_007.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_008.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_010.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_011.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_027.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_032_ctn_4_201.atf
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_033.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_039.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_040.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_041.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_042.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_046.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_085.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_087.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_2_142.atf 
/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_2_192.atf

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/ctn_4_010.atf 
00atf/ctn_4_010.atf:8:P363425: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/ctn_4_010.atf:9:P363425: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/ctn_4_010.atf:21:P363425: link symbol 'B' not defined
ATF processor ox issued 3 warnings and 0 notices```

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/brm_4_06.atf 
00atf/brm_4_06.atf:113:P363407: (lem) %sux:he₂-pad₃-da-eš=+pad[find//adjure]V/pad#~$: must give EPOS when giving SENSE with new lemm
ATF processor ox issued 1 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/bb_2_005.atf
00atf/bb_2_005.atf:5:P363269: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/bb_2_005.atf:72:P363269: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/mul-apin.atf 00atf/mul-apin.atf:7:Q002715: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/mul-apin.atf:8:Q002715: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
[...]
ATF processor ox issued 65 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu-maths.atf 00atf/sptu-maths.atf:248:P348523: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu-maths.atf:259:P348523: link symbol 'A' not defined
00atf/sptu-maths.atf:3433:P348766: note tag 1 has multiple notes attached to it
[...]
ATF processor ox issued 15 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_090.atf 00atf/sptu_1_090.atf:7:P348511: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_1_090.atf:16:P348511: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_091.atf 00atf/sptu_1_091.atf:7:P348512: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_1_091.atf:19:P348512: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_092.atf 00atf/sptu_1_092.atf:7:P348513: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_1_092.atf:15:P348513: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_1_126.atf 00atf/sptu_1_126.atf:392:P348547: (lem) no FORM `{d}PAP.NUNUZ.KAD₄.GUR.x'; 1 match for Papnunuzkadgur[1]DN in glossary cams/gkab:akk-x-stdbab
ATF processor ox issued 1 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_2_040.atf 00atf/sptu_2_040.atf:307:P348645: note tag 1 is used more than once in this line
00atf/sptu_2_040.atf:308:P348645: note tag 1 has multiple notes attached to it
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_2_044.atf 00atf/sptu_2_044.atf:6:P348649: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_2_044.atf:16:P348649: link symbol 'B' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_059.atf 00atf/sptu_3_059.atf:456:P348662: note tag 2 was not used in the preceding line
00atf/sptu_3_059.atf:490:P348662: note tag 3 was not used in the preceding line
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_070.atf 00atf/sptu_3_070.atf:5:P348673: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_070.atf:19:P348673: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_071.atf 00atf/sptu_3_071.atf:5:P348674: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_071.atf:6:P348674: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_071.atf:23:P348674: link symbol 'B' not defined
ATF processor ox issued 3 warnings and 0 notices


/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_072.atf 00atf/sptu_3_072.atf:5:P348675: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_072.atf:6:P348675: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_072.atf:7:P348675: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_072.atf:43:P348675: link symbol 'A' not defined
ATF processor ox issued 4 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_084.atf 00atf/sptu_3_084.atf:229:P348688: (lem) no FORM `a.ab.ba'; 1 match for aʾabak[sea] in glossary cams/gkab:sux
ATF processor ox issued 1 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_088.atf 00atf/sptu_3_088.atf:52:P348692: tagged notes cannot be mixed with untagged ones
ATF processor ox issued 1 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_089.atf 00atf/sptu_3_089.atf:7:P348693: note tag 1 was not used in the preceding line
ATF processor ox issued 1 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_095.atf 00atf/sptu_3_095.atf:6:P348699: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_095.atf:7:P348699: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_095.atf:109:P348699: link symbol 'B' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_3_099.atf 00atf/sptu_3_099.atf:6:P348703: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_3_099.atf:40:P348703: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_4_141.atf 00atf/sptu_4_141.atf:5:P348735: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_4_141.atf:11:P348735: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_4_196.atf 00atf/sptu_4_196.atf:7:P274497: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_4_196.atf:16:P274497: NISIₓ: unknown sign-name grapheme
00atf/sptu_4_196.atf:17:P274497: link symbol 'A' not defined
00atf/sptu_4_196.atf:43:P274497: NISIₓ(SAR): additional instance of unknown grapheme
ATF processor ox issued 4 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_235.atf 00atf/sptu_5_235.atf:4:P348822: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_5_235.atf:5:P348822: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_5_235.atf:59:P348822: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_241.atf 00atf/sptu_5_241.atf:4:P348828: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_5_241.atf:95:P348828: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/sptu_5_264.atf 00atf/sptu_5_264.atf:7:P348851: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/sptu_5_264.atf:18:P348851: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_004.atf 00atf/stt_1_004.atf:5:P338320: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_004.atf:12:P338320: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_005.atf 00atf/stt_1_005.atf:5:P338321: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_005.atf:6:P338321: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_005.atf:12:P338321: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_006.atf 00atf/stt_1_006.atf:5:P338322: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_006.atf:13:P338322: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_007.atf 00atf/stt_1_007.atf:5:P338323: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_007.atf:6:P338323: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_007.atf:7:P338323: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_007.atf:18:P338323: link symbol 'A' not defined
ATF processor ox issued 4 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_008.atf 00atf/stt_1_008.atf:5:P338324: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_008.atf:6:P338324: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_008.atf:17:P338324: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_010.atf 00atf/stt_1_010.atf:5:P338326: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_010.atf:172:P338326: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_011.atf 00atf/stt_1_011.atf:5:P338327: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_011.atf:12:P338327: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_027.atf 00atf/stt_1_027.atf:6:P338344: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_027.atf:7:P338344: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_027.atf:8:P338344: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_027.atf:9:P338344: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_027.atf:22:P338344: link symbol 'D' not defined
ATF processor ox issued 5 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_032_ctn_4_201.atf 00atf/stt_1_032_ctn_4_201.atf:6:P338349: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:7:P338349: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:8:P338349: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:9:P338349: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:24:P338349: link symbol 'A' not defined
00atf/stt_1_032_ctn_4_201.atf:457:P363615: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:458:P363615: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:459:P363615: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:460:P363615: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_032_ctn_4_201.atf:471:P363615: link symbol 'A' not defined
ATF processor ox issued 10 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_033.atf 00atf/stt_1_033.atf:6:P338350: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_033.atf:7:P338350: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_033.atf:8:P338350: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_033.atf:9:P338350: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_033.atf:22:P338350: link symbol 'B' not defined
ATF processor ox issued 5 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_039.atf 00atf/stt_1_039.atf:5:P338356: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_039.atf:10:P338356: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_040.atf 00atf/stt_1_040.atf:5:P338357: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_040.atf:6:P338357: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_040.atf:18:P338357: link symbol 'C' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_041.atf 00atf/stt_1_041.atf:5:P338358: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_041.atf:6:P338358: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_041.atf:12:P338358: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_042.atf 00atf/stt_1_042.atf:5:P338359: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_042.atf:6:P338359: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_042.atf:11:P338359: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_046.atf 00atf/stt_1_046.atf:378:P338364: note tag 1 is used more than once in this line
00atf/stt_1_046.atf:379:P338364: note tag 1 is used more than once in this line
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_085.atf 00atf/stt_1_085.atf:5:P338402: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_085.atf:15:P338402: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_1_087.atf 00atf/stt_1_087.atf:5:P338404: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_1_087.atf:83:P338404: link symbol 'A' not defined
ATF processor ox issued 2 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_2_142.atf 00atf/stt_2_142.atf:5:P338462: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_2_142.atf:6:P338462: malformed link: protocol: no PROJECT (format is now PROJECT:PQX-ID)
00atf/stt_2_142.atf:16:P338462: link symbol 'A' not defined
ATF processor ox issued 3 warnings and 0 notices

/Users/raquel/workspace/ORACC/whole_corpus/whole_corpus/cams/gkab/00atf/stt_2_192.atf 00atf/stt_2_192.atf:356:P338511: note tag 2 was not used in the preceding line
ATF processor ox issued 1 warnings and 0 notices

These break the syntax highlight:

whole_corpus/cams/gkab/00atf/ctn_4_05[4-8].atf

jenshnielsen · 2016-04-26T09:19:12Z

progress is here https://github.com/jenshnielsen/pyoracc/tree/improvecorpuscover

jenshnielsen · 2016-04-26T09:20:51Z

Fixed an issue with various forms of ' being used in t_transctrl_ID but now the file fails because SCORELABEL is not implemented in the parser

jenshnielsen · 2016-04-26T12:07:42Z

At least the @MUD and similar in translations are for Foreign words in Translations. This is not implemented at this stage (documented here)

jenshnielsen · 2016-04-27T08:36:22Z

Rerun with improved error messages:

Sample corpus:

Parsing file /Users/jhn/ucl/oracc/pyoracc/pyoracc/test/fixtures/sample_corpus/cmawro-01-01.atf ... Failed with message: 'PyOracc could not parse token 'LexToken(SCORELABEL,'A₁_obv_i_1′',18,371)''
Parsing file /Users/jhn/ucl/oracc/pyoracc/pyoracc/test/fixtures/sample_corpus/SAA06_08.atf ... Failed with message: 'PyOracc could not parse token 'LexToken(ID,'space',220,5705)''
Parsing file /Users/jhn/ucl/oracc/pyoracc/pyoracc/test/fixtures/sample_corpus/SAA10.atf ... Failed with message: 'PyOracc could not parse token 'LexToken(NEWLINE,'\n\n\n\n\n',4943,119192)''

jenshnielsen · 2016-06-23T11:02:11Z

New corpus as of today https://gist.github.com/jenshnielsen/82bd8a859a3ed556641a91dd540231ab

Adding new changes from rillian.

rillian pushed a commit to rillian/pyoracc that referenced this issue Jun 11, 2019

Merge pull request oracc#41 from oracc/master

8d00aa7

Adding new changes from rillian.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Make sure that full corpus passes #41

Make sure that full corpus passes #41

jenshnielsen commented Apr 25, 2016 •

edited

Loading

jenshnielsen commented Apr 25, 2016 •

edited

Loading

jenshnielsen commented Apr 25, 2016

jenshnielsen commented Apr 25, 2016

raquelalegre commented Apr 25, 2016 •

edited

Loading

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 27, 2016 •

edited

Loading

jenshnielsen commented Jun 23, 2016

Make sure that full corpus passes #41

Make sure that full corpus passes #41

Comments

jenshnielsen commented Apr 25, 2016 • edited Loading

jenshnielsen commented Apr 25, 2016 • edited Loading

jenshnielsen commented Apr 25, 2016

jenshnielsen commented Apr 25, 2016

raquelalegre commented Apr 25, 2016 • edited Loading

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 26, 2016

jenshnielsen commented Apr 27, 2016 • edited Loading

jenshnielsen commented Jun 23, 2016

jenshnielsen commented Apr 25, 2016 •

edited

Loading

jenshnielsen commented Apr 25, 2016 •

edited

Loading

raquelalegre commented Apr 25, 2016 •

edited

Loading

jenshnielsen commented Apr 27, 2016 •

edited

Loading