Fix before version 1.0

From Icelandic Parsed Historical Corpus (IcePaHC)
Jump to: navigation, search

Below are errors found in v0.9 that need to be dealt with.

Sanity checks

bad-advp.q

(ADVP* idoms ADV) AND (ADVP* idoms RP)

Fix: En þeir Pálnatóki og Sveinn röru út eftir (1260.JOMSVIKINGAR.NAR-SAG,.1358)

Þegar þing$ $inu sleit og þeir feðgar fóru heimleiðis heyrða ég getið eftir þeim skyggnu að líka hefði sést þar merki til að djöflagangur$ $inn hefði þá inn eftir sveimað og sést hefði (1659.PISLARSAGA.BIO-AUT,.259)

og fékk sá er þar upp á vakta skyldi sléttar þakkir fyrir umhirðing sína .-. (1791.JONSTEINGRIMS.BIO-AUT,139.1108)

ég skal reyna að staulast með þér fram eftir ,-, ef þú vilt .-. (1850.PILTUR.NAR-FIC,.1252)

maddama góð ,-, ég dróst hingað fram eftir með honum Guðmundi mínum ,-, rétt að gamni mínu ,-, (1850.PILTUR.NAR-FIC,.1356)

Við glugga þar rétt uppi yfir sat Ragnheiður litla ,-, dóttir biskups ,-, (1882.TORFHILDUR.NAR-FIC,.1444)

(PP (P Við-við)
    (NP (N-A glugga-gluggi)
        (ADVP (ADV þar-þar) (ADV rétt-rétt) (ADV uppi-uppi) (RP yfir-yfir))))

svo aftur varð ungu mönnu$ $num í dal$ $num ,-, að líta löngum augum upp eftir til hans Brands á Fossi .-. (1902.FOSSAR.NAR-FIC,.11)

Vegur$ $inn frá Grund og þangað fram er drjúgum langur ,-, (1902.FOSSAR.NAR-FIC,.866)

til þess að ræða við hann um það ,-, sem fram undan sé ,-, burtför hans úr þessum heimi ,-, er fyrir honum liggi að leiða til lykta í Jerúsalem .-. (1920.ARIN.REL-SER,.713)

og hún heimtaði að ég kæmi inn fyrir og fengi kaffi .-. (1985.MARGSAGA.NAR-FIC,.118)

og ég strauk höndu$ $num niður eftir hrygg$ $num og aftur upp (2008.MAMMA.NAR-FIC,.486)

bad-argument.q

(!IP*|VP|RRC*|FRAG iDoms *-SBJ*|*-OB[12]*)

Why is FRAG a part of this query?

This sanity check found this QTP, where the NPs were marked NP-SBJ, NP-OB1, NP-OB2. The verb gera/gjöra is probably missing but I think we can't mark these NPs as arguments without it:

Ó ,-, drottinn minn jesús kristus ,-, þakkir eg þér af öllum mætti .-. (1525.ERASMUS.NAR-SAG,.131)

This sanity check found the FS (false start) item NP-SBJ þið. According to the PPCEME guidelines, "[w]ithin a false start, internal structure is indicated as far as is feasible." However, I think this does not necessarily extend to single NPs, so I have changed FS idoms NP-SBJ to FS idoms NP.

Hvort þið ætlið þið að ég muni að heldur vilja trúa á þann krossfesta Cristum er þessi maður boðar af .-. (1525.GEORGIUS.NAR-REL,.1032)

Similarly, although this echo question clearly shows a subject and an object, the NPs cannot be tagged as arguments in the QTP.

"-" Þér beðið hennar ?-? "-" (1888.VORDRAUMUR.NAR-FIC,.444)

And although the ADJP in the following can have the dash tag -LOC (ADJP-LOC), the NP must be bare, i.e. cannot be NP-SBJ:

Skratt$ $inn fjarri mér .-. (1908.OFUREFLI.NAR-FIC,.852)

The NP in the following heading/title is obviously a subject, but still it must be parsed as NP but not NP-SBJ.

Konu saknað (1985.MARGSAGA.NAR-FIC,.708)

Another example of internal structure of QTP I changed (NP-OB1 > NP; NP-SBJ > NP):

- Bara ,-, Ekkert ,-, Við Tómas .-. (2008.MAMMA.NAR-FIC,.1459)

bad-cp-adv.q

(CP-ADV* exists) AND (!IP*|PP*|$ROOT|CONJP*|CP-ADV* idoms CP-ADV*)

Why isn't QTP included here?

Are the following the right parse for CP-ADV?

( (IP-MAT (PP (P Í-í)
	      (NP (N-D nafni-nafn)
		  (NP-POS (N-G samhljóðanda-samhljóðandi)
			  (Q-G hvers-hver)
			  (CP-ADV (CODE {COM:unsure_of_parse})
				  (WADVP-1 0)
				  (C sem-sem)
				  (IP-SUB (ADVP *T*-1)
					  (ADVP (ADV eins-eins)))))))
				      (NP (NP-MSR (PRO-D því-það))
					  (ADJR-D frekara-frekur)
					  (N-D fylgi-fylgi)
					  (CONJP (CONJ og-og)
						 (NX (N-D framkvæmd-framkvæmd)))
					  (CP-ADV (WADVP-3 0)
						  (C sem-sem)
						  (IP-SUB (ADVP *T*-3)
							  (NP-SBJ (PRO-N hann-hann))
							  (BEDI var-vera)
							  (NP-PRD (QR-N meiri-mikill)
								  (N-N skörungur-skörungur)
								  (NP-CMP (D-D hinum-hinn)))
							  (PP (P að-að)
							      (NP (N-D lærdómi-lærdómur) (CONJ og-og) (N-D röggsemd-röggsemd))))))))))
	  (. .-.))
  (ID 1725.BISKUPASOGUR.NAR-REL,.141))
( (IP-MAT (IP-MAT-1 (PP (P Um-um)
			(NP (Q-A allt-allur) (D-A þetta-þessi)))
		    (MDDS skyldu-skulu)
		    (DO gerast-gera)
		    (NP-SBJ (NUM-N 3-þrír) (NS-N genpartar-genpartur))
		    (, ,-,)
		    (PP (P með-með)
			(NP (NP-POS (PRO-G þeirra-hann)
				    (ADVP (CP-ADV (CODE *XXX*)
						  (WADVP-2 0)
						  (C sem-sem)
						  (IP-SUB (ADVP *T*-2)
							  (ALSO og-og)
							  (NP-POS (NUM-G tveggja-tveir) (ADJ-G erlegra-erlegur) (NS-G manna-maður))))))
			    (NS-D undirskriftum-undirskrift)))

Should the CP-ADV here be CP-FRL?

( (IP-MAT (CONJ en-en)
	  (NP-SBJ (PRO-N hann-hann))
	  (VBDI sagði-segja)
	  (NP-OB1 (CODE *XXX*)
		  (CP-ADV (WADVP-1 0)
			  (C sem-sem)
			  (IP-SUB (ADVP *T*-1)
				  (NP-SBJ *exp*)
				  (VBN farið-fara)
				  (HVDI hafði-hafa)))))
  (ID 1450.VILHJALMUR.NAR-SAG,14.198))

In the following, shouldn't CP-CMP idominate IP-SUB and IP-SUB idominate CP-THT (not CP-ADV). I also don't think that the ADVP-TMP is moved from within the CP-ADV.

( (IP-MAT (ADVP (ADVR Svo-svo)
		(CP-CMP (WADVP-1 0)
			(C sem-sem)
			(ADVP-TMP-2 (ADV nú-nú))
			(CODE {COM:unsure})
			(CP-ADV (C að-að)
				(IP-SUB (WADVP *T*-1)
					(ADVP-TMP *ICH*-2)
					(NP-SBJ (NPR-N Jón-jón)
						(N-N stjúpsonur-stjúpsonur)
						(NP-POS (PRO-N minn-minn)))
					(BEDI var-vera)
					(ADJP (ADJ-N laus-laus))
					(PP (P í-í)
					    (NP (Q-D öllu-allur)
						(NP-POS (PRO-D sínu-sinn))
						(N-D ráði-ráð)))))))
	  (VBDI ráðfærði-ráðfæra)
	  (NP-SBJ (PRO-N eg-ég))
	  (NP-OB1 (PRO-A mig-ég))
...
  (ID 1791.JONSTEINGRIMS.BIO-AUT,157.1472))

bad-cp-frl-1.q

(!ADJP-SPR|ADVP*|NP*|CP-FRL*|CONJP idoms CP-FRL*)

There are 9 instances of PP idominating CP-FRL (which is not ruled out, see discussion here). Now the question is whether cases like the following have the right parse, that is PP idoms CP-FRL.

( (IP-MAT (IP-MAT-1 (NP-SBJ (N-N Geirmundur-geirmundur))
		    (BEDI var-vera)
		    (ADJP (ADJP (ADJ-N bráðþroska-bráðþroska))
			  (CONJP (CONJ og-og)
				 (NP (NP-POS (N-G frískleika-frískleiki))
				     (N-N piltur-piltur))))
		    (, ,-,)
		    (PP (CP-FRL (WPP-2 (P til-til)
				       (WNP (WPRO-G hvers-hver)))
				(C sem-sem)
				(IP-SUB (PP *T*-2)
					(NP-SBJ (PRO-N hann-hann))
					(VBDI gekk-ganga)))))

bad-cp-rel.q

([1]CP-REL|CP-DEG|CP-DEG-SPE|CP-REL-SPE exists) AND (IP*|PP*|$ROOT idoms [1]CP-REL|CP-DEG|CP-DEG-SPE|CP-REL-SPE)

Is the following parse alright (CP-REL on clause level)?

( (IP-IMP-SPE (CONJ og-og)
	      (VBPI gleðjist-gleðja)
	      (ADVP-TMP (ADV ei-ei) (CONJ og-og) (ADV ei-ei))
	      (PP (P í-í)
		  (NP (N-D augliti-auglit)
		      (NP-POS (PRO-D mínu-minn))))
	      (, ,-,)
	      (CODE {COM:on_empty_imp_subject})
	      (CP-REL-SPE (WNP-1 0)
			  (C er-er)
			  (IP-SUB-SPE (NP-SBJ *T*-1)
				      (ADVP-TMP (ADVR fyrr-fyrr))
				      (DODI gerðuð-gera)
				      (NP-OB1 (NP-POS (PRO-A minn-minn))
					      (N-A vilja-vilji))))
	      (. .-.)
	      (" "-"))
  (ID 1150.HOMILIUBOK.REL-SER,.1060))

Is this OK?

			  (IP-SUB (NP-SBJ *T*-1)
				  (HVDI hafði-hafa)
				  (VBN veitt-veita)
				  (NP-OB2 (NPR-A Gretti-grettir))
				  (, ,-,)
				  (PP (P við-við)
				      (NP (SUCH-A slíkt-slíkur) (N-A ofurefli-ofurefli))
				      (CP-REL (WPP-2 0)
					      (C sem-sem)
					      (IP-SUB (NP-SBJ (PRO-N hann-hann))
						      (VBDI átti-eiga)
						      (IP-INF (PP *T*-2)
							      (TO að-að)
							      (VB eiga-eiga)))))))))
	  (. .-.))
  (ID 1310.GRETTIR.NAR-SAG,.1265))

bad-double-nom.q

TTT-problem?

	      (CP-THT-SPE-PRN-2 (C að-að)
				(IP-SUB-SPE (NP-OB1 (N-A vald-vald)
						    (CONJ og-og)
						    (N-A skipan-skipan)
						    (, ,-,)
						    (N-A forræði-forræði)
						    (CONJ og-og)
						    (N-N varðveisla-varðveisla)
						    (CODE {strange_nominative})
						    (NP-POS (NPR-G Oddastaðar-oddastaður)
							    (CONJ og-og)
							    (NPR-G Ólafskirkju-ólafskirkja)
							    (PP (P í-í)
								(NP (NPR-D Vatnsfirði-vatnsfjörður))))

Strange sentence (look at the NP-ADV - is this really the right parse?; NP-MSR would also be pretty strange but probably a better parse):

	      (CP-THT-SPE-PRN-1 (C að-að)
				(IP-SUB-SPE (CODE {COM:unsure_of_meaning})
					    (NP-OB1 (ADJ-N ófært-ófær)
						    (N-N lið-lið)
						    (NP-PRN (CONJ bæði-bæði)
							    (NP (N-N kerling$-kerling)
								(D-N $in-hinn)
								(, ,-,)
								(NP-PRN (N-N móðir-móðir)
									(NP-PRN (FW Darii-darius))))
							    (, ,-,)
							    (CONJP (CONJ og-og)
								   (NP (NS-N dætur-dóttir)
								       (NP-POS (PRO-G hans-hann))))))
					    (BEPS sé-vera)
					    (VAN gefið-gefa)
					    (ADVP-DIR (ADV aftur-aftur))
					    (NP-SBJ (NPRS-D Serkjum-serki))
					    (CODE *XXX*)
					    (NP-ADV (QP (ADVR svo-svo) (Q-N mikið-mikill))
						    (N-N gull-gull)
						    (, ,-,)
						    (CP-CMP-SPE (WNP-2 0)
								(C sem-sem)
								(IP-SUB-SPE (NP-SBJ *T*-2)
									    (ADVP-LOC (ADV þar-þar))
									    (BEPI er-vera)
									    (PP (P í-í)
										(NP (N-D móti-mót)))
									    (VAN boðið-bjóða))))))
	      (, ,-,)

bad-hver.q

Are these parses OK (look at NP-SBJ hver) or is it simply a quantifier?

( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (VBDI sagði-segja)
	  (ADVP-TMP (ADV þá-þá))
	  (CP-QUE (WNP-1 (WPRO-A hvað-hver))
		  (C 0)
		  (IP-SUB (NP-OB1 *T*-1)
			  (NP-SBJ (WPRO-N hver-hver))
			  (MDDS skyldi-skulu)
			  (RP að-að)
			  (DO gera-gera)))
	  (, ,-,)
							    (CONJP (ADVP (ADV svo-svo))
								   (ALSO og-og)
								   (NP (N-A prófan-prófan)
								       (CONJ og-og)
								       (N-A dóm-dómur)
								       (CP-QUE-PRN (WADVP-7 (WADV hversu-hversu))
										   (C 0)
										   (IP-SUB (NP-SBJ (WPRO-N hver-hver))
											   (BEPI er-vera)
											   (ADVP (ADVP *T*-7)
												 (ADV löglega-löglega))
											   (PP (P til-til)
											       (NP (N-G arfs-arfur)))
											   (VBN kominn-koma))))))))
			(CONJP (ADVP (ADV svo-svo))
			       (ALSO og-og)
			       (PP (P um-um)
				   (NP (N-A dóm-dómur)
				       (CONJ og-og)
				       (N-A prófan-prófan)
				       (CP-QUE-PRN (WADVP-4 (WADV hversu-hversu))
						   (C 0)
						   (IP-SUB (ADVP *T*-4)
							   (NP-SBJ (WPRO-N hver-hver))
							   (BEPI er-vera)
							   (ADVP (ADV löglega-löglega))
							   (PP (P til-til)
							       (NP (N-G arfs-arfur)))
							   (VAN getinn-geta))))))
(IP-SUB-SPE (NP-SBJ (PRO-N þér-þú))
	    (VBPI viðið-vita)
	    (NP-OB1 (PRO-A það-það)
		    (CP-THT-SPE-PRN *ICH*-6))
	    (ADVP (ADV vel-vel))
	    (, ,-,)
	    (CP-THT-SPE-PRN-6 (C að-að)
			      (IP-SUB-SPE (IP-SUB-SPE (NP-ADV-LFD (CP-FRL-SPE (WADJP (WADV hversu-hversu) (ADJ-N megtugur-megtugur))
																					       (C að-að)
																					       (IP-SUB-SPE (NP-SBJ (WPRO-N hver-hver))
																							   (BEPI er-vera)
																							   (PP (ADV hér-hér)
																							       (P á-á)
																							       (NP (N-D jörðu-jörð))))))
( (IP-MAT (CONJ og-og)
	  (NP-SBJ *exp*)
	  (MDDI mátti-mega)
	  (ADVP-DIR (ADV þaðan-þaðan))
	  (VB sjá-sjá)
	  (PP (RP inn-inn)
	      (P um-um)
	      (NP (Q-A allt-allur) (N-A hús$-hús) (D-A $ið-hinn)))
	  (, ,-,)
	  (CP-QUE (WNP-1 (WPRO-N hvað-hver))
		  (C 0)
		  (IP-SUB (NP-OB1 *T*-1)
			  (NP-SBJ (WPRO-N hver-hver))
			  (VBDI tók-taka)
			  (NP-OB2 (PRO-D sér-sig))
			  (PP (P fyrir-fyrir)
			      (NP (NS-A hendur-hönd)))))
	  (. .-.))
  (ID 1882.TORFHILDUR.NAR-FIC,135.1918))


More examples:

( (IP-MAT (NEG Eigi-ekki)
	  (BEPI er-vera)
	  (ADVP-LOC (ADV hér-hér))
	  (VAN greint-greina)
	  (CP-QUE (WNP-1 (WD-N hver-hver)
			 (NP-POS (NS-G vopna-vopn))
			 (NS-N skipti-skipta))
		  (C 0)
		  (IP-SUB (NP-SBJ *T*-1)
			  (PP (P með-með)
			      (NP (WPRO-D hverjum-hver)))
			  (BEDI voru-vera))))
  (ID 1450.VILHJALMUR.NAR-SAG,72.1447))
				  (NP-PRN (CONJ-2 (CODE *XXX*)
						  (OTHER-A annað-annar)
						  (WPRO-A hvert-hver))
					  (N-N líkneski-líkneski)
( (IP-MAT-SPE (ADVP-TMP (ADV nú-nú))
	      (VBDI skildi-skilja)
	      (NP-SBJ (PRO-N hann-hann))
	      (ADVP (ADV auðvitað-auðvitað))
	      (PP (NP (WPRO-G hvers-hver))
		  (P vegna-vegna))
	      (. .-.))
  (ID 1985.MARGSAGA.NAR-FIC,.1253))
( (FRAG (PP (P Af-af)
	    (NP (WPRO-D hverju-hver)))
	(IP-INF (RP af$-af)
		(VB $sala-sala)
		(NP-OB2 (PRO-D sér-sig))
		(NP-OB1 (N-D veröld-veröld)
			(NP-POS (N-G barns$-barn) (D-G $ins-hinn))))
	(. ?-?))
  (ID 1985.SAGAN.NAR-FIC,.810))
		    (PP (P þótt-þótt)
			(CP-ADV (C 0)
				(IP-SUB (NP-OB1 (PRO-N það-það)
						(CP-QUE-PRN *ICH*-2))
					(BEPS sé-vera)
					(NP-SBJ (MAN-D manni-maður))
					(ADVP (ADV kannski-kannski))
					(NEG ekki-ekki)
					(ADVP (ADVS efst-efra))
					(PP (P í-í)
					    (NP (N-D huga-hugi)))
					(NP-TMP (Q-A alla-allur) (NS-A daga-dagur))
					(CP-QUE-PRN-2 (WNP-3 (WPRO-N hver-hver))
						      (C 0)
						      (IP-SUB (NP-SBJ *T*-3)
							      (VBDI vó-vega)
							      (NP-OB1 (WPRO-A hvern-hver))
							      (PP (P fyrir-fyrir)
								  (NP (NUM-D tveimur-tveir) (NS-D áratugum-áratugur)))))))))

bad-ip-daughter.q

IP* idoms NP

	  (CONJP (CONJ og-og)
		 (IP-MAT=1 (ADVP (ADV svo-svo))
			   (CODE *XXX*-laga)
			   (NP (D-D hinum-hinn)
			       (CP-REL (WNP-3 0)
				       (C sem-sem)
				       (IP-SUB (NP-SBJ *T*-3)
					       (NP-TMP (D-A hið-hinn) (ADJR-A fyrra-fyrri) (N-A sumar-sumar))
					       (VBDI komu-koma))))))
	  (. .-.))
  (ID 1325.ARNI.NAR-SAG,.592))
( (IP-MAT (IP-MAT-1 (NP-SBJ-2 *exp*)
		    (BEDI Var-vera)
		    (ADVP-TMP (ADV nú-nú))
		    (NP-2 (N-N gnýr-gnýr) (Q-N mikill-mikill)))
	  (CONJP (CONJ og-og)
		 (IP-MAT=1 (ADVP-TMP (NP (PRO-D því-það))
				     (ADVS næst-nær))
			   (NP (N-N bardagi-bardagi))
			   (CODE *XXX*-laga)))
	  (. .-.))
  (ID 1450.VILHJALMUR.NAR-SAG,111.2362))
( (IP-MAT-SPE (CONJ og-og)
	      (PP (P fyrir-fyrir)
		  (NP (D-A það-sá) (ADJ-A sama-samur)))
	      (VBPI stendur-standa)
	      (NP-SBJ (PRO-N eg-ég))
	      (ADVP-TMP (ADV nú-nú))
	      (PP (P í-í)
		  (NP (ADJ-D sömu-samur)
		      (N-D pínu-pína)
		      (CP-CMP-SPE (WNP-1 0)
				  (C sem-sem)
				  (IP-SUB-SPE (CODE *XXX*-laga)
					      (NP *T*-1)
					      (NP-SBJ (D-N þessir-þessi)
						      (CP-REL-SPE (WNP-2 0)
								  (C er-er)
...
  (ID 1475.AEVINTYRI.NAR-REL,.958))

bad-np-prd.q

	      (CP-ADV (C að-að)
		      (IP-SUB (NP-SBJ (ADJ-N góð-góður)
				      (NPR-N dæmi-dæmi)
				      (NP-PRN (PRO-N ór-vor)))
			      (VBPS lýsi-lýsa)
			      (PP (P innan-innan)
				  (NP (N-A musteri-musteri)
				      (NP-POS (NPR-G Guðs-guð))
				      (, ,-,)
				      (IP-MAT-PRN (NP-SBJ (PRO-N það-það))
						  (BEPI er-vera)
						  (NP-PRD (ADJ-A kristinn-kristinn) (N-A lýð-lýður))))))))
	  (. .-.))
  (ID 1150.HOMILIUBOK.REL-SER,.2105))

Beside NP-PRD problem here, is alla rétttrúaða og líka dásamlega NP-OB1 in IP-INF?

			  (CP-THT (C að-að)
				  (IP-SUB (NP-SBJ (PRO-N þú-þú))
					  (VBPS viljir-vilja)
					  (NP-OB1 (NP-POS (PRO-A þína-þinn))
						  (VAN-A útvalda-útvelja))
					  (, ,-,)
					  (IP-MAT-PRN (NP-SBJ (PRO-N það-það))
						      (BEPI er-vera)
						      (, ,-,)
						      (NP-PRD (Q-A alla-allur)
							      (ADJP (ADJP (ADJ-A rétttrúaða-rétttrúaður))
								    (CONJP (CONJ og-og)
									   (ADVP (ADV líka-líka))
									   (ADJP (ADJ-A dásamlega-dásamlegur))))))
					  (IP-INF (VB leiða-leiða)
						  (PP (P í-í)
						      (PP (P gegnum-gegnum)
							  (NP (D-A þennan-þessi) (N-A eymdardal-eymdardalur)))))))))
	  (. .-.))
  (ID 1593.EINTAL.REL-OTH,.299))

Beside NP-PRD problem here, is til maybe a preposition?

( (IP-MAT (NP-SBJ (PRO-N Hann-hann))
	  (VBDI bauðst-bjóða)
	  (RP til-til)
	  (IP-INF (NP-OB1 (NP (Q-A hvert-hver) (ADJ-A nýtt-nýr) (N-A sár-sár))
			  (CONJP *ICH*-2))
		  (TO að-að)
		  (VB lækna-lækna)
		  (PP (P í-í)
		      (NP (NUM-A tólf-tólf)
			  (NS-A tíma-tími)
			  (, ,-,)
			  (CP-REL (WNP-1 0)
				  (C sem-sem)
				  (IP-SUB (NP-SBJ *T*-1)
					  (BEPI er-vera)
					  (NP-PRD (N-N dægur-dægur))))))
		  (, ,-,)
		  (CONJP-2 (CONJ og-og)
			   (NP (Q-A hvern-hver)
			       (N-A sting-stingur)
			       (, ,-,)
			       (CP-QUE (WNP-3 (WPRO-N hver-hver))
				       (C 0)
				       (IP-SUB (NP-SBJ *T*-3)
					       (PP (P í-í)
						   (ADVP (ADV gegn-gegn)))
					       (VAN stunginn-stinga)
					       (BEDS væri-vera)
					       (, ,-,)
					       (NP-OB2 (CODE *XXX*)
						       (CP-FRL (WNP-4 0)
							       (C sem-sem)
							       (IP-SUB (NP-SBJ *T*-4)
								       (BEPI er-vera)
								       (NP-PRD (Q-A alla-allur) (NS-A útlimi-útlimur))))))))))
	  (. .-.))
  (ID 1661.INDIAFARI.BIO-TRA,62.974))
( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (VBPI setja-setja)
	  (NP-OB1 (PRO-A hann-hann)
		  (CP-REL *ICH*-1))
	  (PP (P í-í)
	      (NP (NP-POS (NPR-G guðs-guð))
		  (N-D kirkju-kirkja)))
	  (, ,-,)
	  (CP-REL-1 (WNP-2 0)
		    (C sem-sem)
		    (IP-SUB (NP-SBJ *T*-2)
			    (IP-INF (BE vera-vera)
				    (NP-PRD *ICH*-3))
			    (VBDI átti-eiga)
			    (NP-3 (N-N hjarta-hjarta)
				  (NP-POS (PRO-G þeirra-hann)))
			    (, ,-,)
			    (IP-MAT-PRN (NP-SBJ (PRO-N það-það))
					(BEPI er-vera)
					(NP-PRD (D-A hina-hinn)
						(ADJS-A örgustu-argur)
						(N-A svívirðingu-svívirðing)
						(NP-POS (N-G foreyðslun$-foreyðslun) (D-G $nar-hinn)))
					(PP (P í-í)
					    (NP (D-A þann-sá)
						(N-A stað-staður)
						(CP-REL (WNP-4 0)
							(C sem-sem)
							(IP-SUB (NP-SBJ *T*-4)
								(VBDS ætti-eiga)
								(IP-INF (TO að-að)
									(BE vera-vera)
									(NP-PRD (D-N hinn-hinn)
										(NP-POS (Q-G allra-allur))
										(ADJS-N helgasti-helgur))))))))))
	  (. .-.))
  (ID 1720.VIDALIN.REL-SER,.460))
	  (ADVP-TMP-RSP (ADV þá-þá))
	  (VBPI tjalda-tjalda)
	  (NP-SBJ (PRO-N eg-ég))
	  (NP-OB1 (D-D því-sá)
		  (CP-REL (WNP-1 0)
			  (C sem-sem)
			  (IP-SUB (NP-OB1 *T*-1)
				  (NP-SBJ *pro*)
				  (RP til-til)
				  (VBPS hefi-hafa)))
		  (, ,-,)
		  (CODE *XXX*)
		  (CP-REL (WNP-2 0)
			  (C sem-sem)
			  (IP-SUB (NP-SBJ *T*-2)
				  (BEPI er-vera)
				  (NP-PRD (D-D þessu-þessi) (N-D ágripi-ágrip))
				  (PP (P af-af)
				      (NP (NP-POS (PRO-G hans-hann))
					  (N-D ævi-ævi))))))
	  (. .-.))
  (ID 1725.BISKUPASOGUR.NAR-REL,.9))
( (IP-MAT (NP-SBJ (PRO-N þau-það))
	  (BEDI voru-vera)
	  (CODE *XXX*)
	  (NP-PRD (OTHERS-D öðrum-annar) (CONJ og-og) (ADJ-D þriðja-þriðji))
	  (. ,-,))
  (ID 1725.BISKUPASOGUR.NAR-REL,.481))
( (IP-MAT (" "-")
	  (INTJ O<dash>já-ojá)
	  (, ,-,)
	  (NP-SBJ (PRO-N það-það))
	  (BEDI var-vera)
	  (NP-PRD (CODE *XXX*)
		  (PRO-D mér-ég)
		  (CP-EOP (WNP-1 0)
			  (IP-INF (NP-OB2 *T*-1)
				  (TO að-að)
				  (VB kenna-kenna))))
	  (" "-")
	  (, ,-,)
	  (IP-MAT-PRN (VBDI sagði-segja)
		      (NP-SBJ (NPR-N Þorgeir-þorgeir))
		      (ADVP (ADV þurlega-þurlega)))
	  (. .-.))
  (ID 1907.LEYSING.NAR-FIC,.278))
( (IP-MAT (CONJ Og-og)
	  (NP-SBJ (PRO-N það-það))
	  (BEDI var-vera)
	  (CODE *XXX*)
	  (NP-PRD (N-D dyraverð$-dyravörður)
		  (D-D $inum-hinn)
		  (CP-EOP (WNP-1 0)
			  (IP-INF (NP-OB1 *T*-1)
				  (TO að-að)
				  (VB kenna-kenna))))
	  (. .-.))
  (ID 1985.MARGSAGA.NAR-FIC,.1126))

bad-ob1-1.q

(IP* idoms NP-OB1*) AND (NP-OB1* idoms *-D) AND (NP-OB1* hasSister VAN|DAN|RAN|MAN|HAN)

( (IP-MAT (IP-MAT-1 (CONJ og-og)
		    (NP-SBJ *exp*)
		    (BEDI var-vera)
		    (NP-OB1 (PRO-D því-það)
			    (CP-THT-PRN *ICH*-2))
		    (VAN búið-búa)
		    (CP-THT-PRN-2 (C að-að)
				  (IP-SUB (NP-SBJ (PRO-N hann-hann))
					  (MDDS mundi-munu)
					  (VB standa-standa)
					  (PP (P á-á)
					      (NP (PRO-D honum-hann))))))
	  (. ,-,)
	  (CONJP (IP-MAT=1 (VB snúa-snúa)
			   (PP (P við-við)
			       (NP (PRO-A það-það)))
			   (ADVP (ADV aftur-aftur))
			   (PP (P til-til)
			       (NP (NS-G hesta-hestur)
				   (NP-POS (PRO-G sinna-sinn)))))))
  (ID 1400.GUNNAR.NAR-SAG,.230))
	  (VBDI tóku-taka)
	  (NP-SBJ (PRO-N þeir-hann))
	  (IP-INF (TO að-að)
		  (RD verða-verða)
		  (NP-OB1 (N-D efa-efi))
		  (VAN blandnir-blanda)
...
  (ID 1540.NTACTS.REL-BIB,239.253))
( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (BEDI var-vera)
	  (PP-BY (P af-af)
		 (NP (NS-D bræðru$-bróðir) (D-D $num-hinn)))
	  (NP-OB1 (NP-POS (NPR-G Guðs-guð))
		  (N-D náð-náð))
	  (VAN bífalaður-bífala)
	  (. .-.))
  (ID 1540.NTACTS.REL-BIB,271.986))
	  (CP-ADV (C að-að)
		  (IP-SUB (IP-SUB (NP-SBJ (PRO-N eg-ég))
				  (PP (P með-með)
				      (NP (ADJ-D réttri-réttur) (N-D iðran-iðran)))
				  (BEPS sé-vera)
				  (NP-OB1 (N-D veröldu$-veröld) (D-D $nni-hinn))
				  (RP frá$-frá)
				  (VAN $snúinn-snúa))
			  (CONJP (CONJ og-og)
				 (IP-SUB (NP-SBJ *con*)
					 (NP-OB2 (PRO-D þér-þú))
					 (PP (P í-í)
					     (NP (Q-D allri-allur) (N-D eilífð-eilífð)))
					 (VAN samtengdur-samtengja)
					 (RDPS verði-verða)))))
	  (. .-.))
  (ID 1593.EINTAL.REL-OTH,.618))

bad-pp-case.q

(P hasSister NP) AND (NP idoms *-N) AND (P idoms !of|en*|nema*)

If of was to be included, it should be of-*, not of* -- but why is of included? It takes accusative case, not nominative.

In addition, this sanity check should maybe include utan*. Or is utan supposed to be an FP when "idominating" nominative?

Is "svo það að ..." correctly parsed below?

			      (IP-SUB (NP-SBJ (Q-N hver-hver) (ONE-N einn-einn))
				      (VBDI heyrði-heyra)
				      (IP-INF (NP-SBJ (PRO-A þá-hann))
					      (VB tala-tala)
					      (NP-OB1 (NP-POS (PRO-G síns-sinn))
						      (N-G tungu-tunga)
						      (CODE VS:II_7P)))
				      (CODE *XXX*)
				      (PP (P svo-svo)
					  (NP (PRO-N það-það)
					      (CP-THT-PRN (C að-að)
							  (IP-SUB (IP-SUB (NP-SBJ (Q-N allir-allur))
									  (VBDI tóku-taka)
									  (IP-INF (IP-INF (TO að-að) (VB óttast-ótta))
										  (CONJP (CONJ og-og)
											 (IP-INF (TO *)
												 (VB undrast-undra)))))
								  (CONJP (CONJ og-og)
									 (IP-SUB (NP-SBJ *con*)
										 (VBDI sögðu-segja)
										 (, :-:)

bad-pp-case2.q

Utan should maybe be excluded.

Some remaining bad-pp-cases:

( (IP-MAT-SPE (CONJ en-en)
	      (NP-SBJ (D-N þau-sá) (FP-N ein-einn))
	      (BEPI eru-vera)
	      (NP-PRD (NS-N kynni-kynni)
		      (CP-REL-SPE *ICH*-1))
	      (CODE *XXX*)
	      (PP (ADV heima-heima)
		  (P að-að)
		  (NP (PRO-G þín-þú)))
...
  (ID 1350.BANDAMENNM.NAR-SAG,.1051))
( (IP-MAT-SPE (NP-SBJ (PRO-N Eg-ég))
	      (BEDI var-vera)
	      (NP-PRD (ONE-N einn-einn) (N-N bakbítari-bakbítari))
	      (PP (P til-til)
		  (IP-INF-SPE (TO að-að)
			      (VB segja-segja)
			      (NP-OB1 (Q-A allt-allur))
			      (PP (P til-til)
				  (NP (NP-POS (PRO-G minna-minn))
				      (NS-G kumpána-kumpáni)))
			      (NP-TMP (N-A nátt-nátt) (CONJ og-og) (N-A dag-dagur))
			      (PP (P að-að)
				  (NP (Q-A allt-allur)))
			      (CP-ADV-SPE (C er-er)
					  (IP-SUB-SPE (NP-SBJ (PRO-N eg-ég))
						      (VBDI vissi-vita)
						      (NP-OB1 (NP-POS (PRO-G þeirra-hann))
							      (N-A vist-vist))))))
	      (. .-.))
  (ID 1475.AEVINTYRI.NAR-REL,.773))
			    (CONJP (CONJ og-og)
				   (IP-SUB (NP-SBJ *con*)
					   (RDDI varð-verða)
					   (IP-INF (TO að-að)
						   (VB loða-loða)
						   (CODE *TTT*)
						   (PP (P af-af)
						       (NP (Q-A hvern-hver)
							   (N-A fingur-fingur)
							   (NP-POS (PRO-G hennar-hún)))))))))
	  (. ,-,))
  (ID 1480.JARLMANN.NAR-SAG,.1255))
Síðan hóf sanktus Erasmus sína bón að þessa lund (1525.ERASMUS.NAR-SAG,.441)
þeir af heiðindóm$ $inn hafa skrifað (1525.GEORGIUS.NAR-REL,.75)
vær erum að Guðs vitni hér allir að vér heyrum alla þá hluti sem þér eru af Guði boðnir .-. (1540.NTACTS.REL-BIB,259.666)

ásamt

En yður alla mína elskulega meðbræður í drottni ásamt allt yðart heimkynni ... (1611.OKUR.REL-OTH,51.624)

handan

En Geirmundur tók eftir því ,-, að séra Jósteinn kom handan gólf$ $ið ,-, hægur og alvarlegur .-. (1902.FOSSAR.NAR-FIC,.812)

ofan

Síðan spruttu af honum bönd$ $in öll og blökkur$ $inn er ofan honum lá (1525.GEORGIUS.NAR-REL,.340)
( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (VBDI leituðu-leita)
	  (PP (P að-að)
	      (NP (NPR-A Jesúm-jesús)))
	  (. .-.))
  (ID 1540.NTJOHN.REL-BIB,197.434))
köstuðu löngum skuggum ofan brekku$ $na ;-; (1902.FOSSAR.NAR-FIC,.918)
ofan alla þá hæð (1882.TORFHILDUR.NAR-FIC,.1669)

um

( (IP-MAT (VBDI Lét-láta)
	  (NP-SBJ (PRO-N hann-hann))
	  (ADVP-LOC (ADV þar-þar))
	  (IP-INF (NP-SBJ *arb*)
		  (VB geyma-geyma)
		  (PP (P um-um)
		      (NP (NS-D vetrum-vetur)))
		  (NP-PB1 (N-G fjár-fé)
			  (NP-POS (PRO-G síns-sinn))))
	  (. .-.))
  (ID 1350.FINNBOGI.NAR-SAG,636.643))
( (IP-MAT (NP-SBJ (PRO-N hann-hann))
	  (VBDI strauk-strjúka)
	  (PP (P um-um)
	      (NP (NS-D augum-auga)
		  (CODE {COM:some_editions_have_'augun'})
		  (PP (P á-á)
		      (NP (PRO-D henni-hún))))))
  (ID 1850.PILTUR.NAR-FIC,.214))

til

With foreign names, I have sometimes changed names that might be interpreted as being accusative or dative as genitive, especially since foreign names often don't show case distinction. However, where latin case is shown, I have in some places changed the possible accusative/dative to genitive. Some of these can be found by looking for a genitive assigning P taking a word ending with m (e.g. til Tessaloníam).

( (IP-MAT (ADVP-TMP (ADV Þá-þá))
	  (MDDI vildi-vilja)
	  (NP-SBJ (NPR-N Björn-björn))
	  (VB róa-róa)
	  (PP (P til-til)
	      (NP (N-D fiski-fiski))))
  (ID 1400.VIGLUNDUR.NAR-SAG,.531))
en snúast til Jesúm Cristum sannan guð og mann .-. (1525.GEORGIUS.NAR-REL,.741)
endurgetinn var hann eftir þeirri guðs skikkan sem varði allt til Kristum ,-, (1720.VIDALIN.REL-SER,.142)
svo það yrði þannig vor tyftunar meistari til Kristum .-. (1720.VIDALIN.REL-SER,.176)
og fyrir þá orsök gaf kongur Friderick annar hingað þrjú sín bréf hér um ,-, það fyrsta til Fridericksborg 
(1725.BISKUPASOGUR.NAR-REL,.108)
hvar hann sat fram á vetur ,-, þar til einu sinni ,-, seint um nótt ,-, (1725.BISKUPASOGUR.NAR-REL,.807)

It might be helpful to search for P til in ntacts and ntjohn; Oddur Gottskálksson might be using accusative sometimes.

( (IP-MAT (CONJ og-og)
	  (NP-SBJ (PRO-N hann-hann))
	  (VBDI sagði-segja)
	  (PP (P til-til)
	      (NP (NPR-A Jesúm-jesús)))
	  (, :-:)

bad-pp-complement-1

Is sig governed by í gegnum or is it NP-OB1?

( (IP-MAT (CONJ Og-og)
	  (ADVP-TMP (ADV þá-þá))
	  (VBDI þótti-þykja)
	  (NP-SBJ (PRO-D hönum-hann))
	  (NP-OB1 (ADJ-N sami-samur) (N-N maður-maður))
	  (IP-INF (VB stinga-stinga)
		  (NP-OB1 (PRO-A sig-sig))
		  (PP (P í-í)
		      (PP (P gegnum-gegnum)))

bad-vb.q

(IP* idoms [1]VB*|VAN) AND ({1}[1]VB*|VAN hasSister [2]VB*|VAN)

      AND ([1]VB*|VAN hasSister !CONJ)

Is this supposed to be a VP?

			  (IP-SUB (NP-SBJ (NPR-N Geirarður-geirarður)
					  (NP-PRN (N-N hertogi-hertogi)))
				  (HVDI hafði-hafa)
				  (VB-3 reisa-reisa)
				  (VBN látið-láta)
				  (IP-INF (CODE *XXX*)
					  (NP-OB1 *T*-2)
					  (VB *ICH*-3)
					  (NP-SBJ *arb*)
					  (PP (P fyrir-fyrir)
					      (NP (NP-POS (PRO-G hans-hann))
						  (N-A bæn-bæn)))
...
  (ID 1350.MARTA.REL-SAG,.843))

bad-wpro.q

(WNP* idoms WPRO*|PRO*) AND (WPRO*|PRO* idoms hv*) AND (WNP* idomstotal> 1) AND (WNP* idoms !ADV*|Q*|*-PRN*)

How are phrases like hvað tíðinda, hvað manna, hvað mönnum, hvor okkar, hverjir af mínum mönnum supposed to be parsed?

branching-conj.q

(CONJ|CONJ-* idomstotal> 1)

There is inconsistency in how we tag annað hvort. As a conjunction, should it be NP-ADV idoms OTHER and WPRO or or OTHER+WPRO idoms OTHER21 and WPRO22?

Word level sanity checks

Add more particles in splitting verbs, include ór (as in e.g. órskurða).

Issues

ADVP svo hasSister CP*

BE idoms *

Should this be deleted?

N21

I have been deleting N21 and NPR21 where it should really be NP-POS, such as in "guðs spjalla maðurinn" (erasmus.797)

Adverbs, particles or ...

1. Fram in fram og aftur and aftur og fram is usually tagged as RP. Is that the right way? (Similarly, I changed niður from RP to ADV in the ADVP norður og niður.)

2. There is a lot of inconsistency in how we parse hér inn, hér inni, þar inn, þar inni. Sometimes these are parsed as ADVP (hér, þar) idominated by PP (inn(i)); sometimes ADVP iprecedes RP. How do we do this?

3. How do we parse fram hjá einhverjum (hann fór fram hjá mér) and fram hjá (hann fór fram hjá)? Similar problem is fram undan.

ECM

	  (PP (P á-á)
	      (NP (D-A þetta-þessi)
		  (N-A hervirki-hervirki)
		  (CP-REL (WNP-2 0)
			  (C er-er)
			  (IP-SUB (NP-SBJ (PRO-N vér-ég))
				  (VBPI trúum-trúa)
				  (NP-OB1 (NP-POS (PRO-A vora-vor))
					  (NS-A menn-maður))
				  (IP-INF (NP-OB1 *T*-2)
					  (VBN þolað-þola)
					  (HV hafa-hafa)
					  (PP (P í-í)
					      (NP (NP-POS (NS-G synda-synd))
						  (N-A gjald-gjald)))
...
  (ID 1350.MARTA.REL-SAG,.859))

Non-inherent ECM:

kveða: fix case nominative to accusative in sentences such as Hann kvað það vera gott

Passive

1. Is it possible to tag the IP-MAT-SPE in the following as the subject and skip the expletive?

				      (ADVP (ADV svo-svo)
					    (CP-CMP-SPE (WADVP-2 0)
							(C sem-sem)
							(IP-SUB-SPE (ADVP *T*-2)
								    (NP-SBJ *exp*)
								    (PP (P í-í)
									(NP (ADJS-D fyrsta-fyrri) (N-D sálmi-sálmur)))
								    (VAN skrifað-skrifa)
								    (BEPI er-vera)
								    (, :-:)
								    (IP-MAT-SPE (NP-SBJ (PRO-N Þú-þú))
										(BEPI ert-vera)
										(NP-PRD (NP-POS (PRO-N minn-minn))
											(N-N son-sonur))))))))
	      (. ,-,))
  (ID 1540.NTACTS.REL-BIB,265.853))

What is the subject?

Passive

In sentences with heita, játa, svipta (or svifta), gifta, hóta, ræna, the indirect object in the active (Ég hét honum konunni, Ég játaði honum þessu, Ég svipti hann konunni, Ég gifti hana honum, Ég hótaði honum líftjóni, Ég rændi hann aleigunni) is usually the subject in the passive (look also for VAN nýgiftur). The direct object in the active should then be parsed as NP-OB1 also in the passive. These should be looked for and fixed if not correctly parsed. (Cf. also the question about giftast on this page.) The same probably goes for helga (Hann helgaði musterið Guði, see such passive sentence in 1920.ARIN.REL-SER,.393) and kvæna.

See also verbs such as fleygja and a dative argument that possibly can be regarded as NP-COM (here of nasir):

Öllum-allur hinum-hinn mörgu-margur ávirðingum-ávirðing dönsku-danskur selstöðuverzlunar$-selstöðuverzlun $innar-hinn ,-, að-að
fornu-forn og-og nýju-nýr ,-, var-vera þeim-það stöðugt-stöðugt fleygt-fleygja á-á nasir-nös .-.
(1907.LEYSING.NAR-FIC,.1275)

in 1250.thetubrot.205

( (IP-MAT (CONJ og-og)
	  (NP-SBJ (PRO-N það-það))
	  (RDDI varð-verða)
	  (VAN sagt-segja)
	  (NP-OB1 (N-D býfógeta$-býfógeti)
		  (D-D $num-hinn)
		  (, ,-,)
		  (NP-PRN (IP-MAT-PRN (NP-SBJ (PRO-N það-það))
				      (BEPI er-vera))
			  (NP-POS (N-G staðar$-staður) (D-G $ins-hinn))
			  (N-D sýslumanni-sýslumaður)))
	  (. .-.))
  (ID 1661.INDIAFARI.BIO-TRA,30.164))
( (IP-MAT (IP-MAT-1 (CONJ En-en)
		    (PP (P með-með)
			(NP (PRO-D því-það)
			    (CP-THT-PRN (C 0)
					(IP-SUB (NP-SBJ (PRO-N hann-hann))
						(HVDI hafði-hafa)
						(ADVP (ADVR svo-svo) (ADV hyggilega-hyggilega))
						(ADVP-DIR (ADV undan-undan))
						(VBN komist-koma)))))
		    (RDDI varð-verða)
		    (NP-SBJ (Q-N engin-enginn) (N-N eftirför-eftirför))
		    (NP-OB1 (PRO-D honum-hann))
		    (VAN veitt-veita)
		    (, ,-,))
...
  (ID 1661.INDIAFARI.BIO-TRA,31.174))
( (IP-MAT (NP-SBJ (D-N Þessi-þessi) (N-N maður-maður))
	  (BEDI var-vera)
	  (VAN léður-ljá)
	  (NP-OB1 (NP-POS (N-G kóngs$-kóngur) (D-G $ins-hinn))
		  (N-D matgjörðamanni-matgjörðamaður)
		  (NP-PRN (NPR-D meistara-meistari) (NPR-D Kristjáni-kristján))
		  (, ,-,)
		  (NP-PRN (D-N sá-sá)
			  (CP-REL (WNP-1 0)
				  (C eð-eð)
				  (IP-SUB (NP-SBJ *T*-1)
					  (HVDI hafði-hafa)
					  (PP (P undir-undir)
					      (NP (PRO-D sér-sig)))
					  (NP-OB1 (NUM-A ellefu-ellefu) (NS-A sveina-sveinn))))))
	  (. .-.))
  (ID 1661.INDIAFARI.BIO-TRA,40.398))
( (IP-MAT (IP-MAT-1 (BEDI Var-vera)
		    (NP-SBJ (NPR-N Guðmundur-guðmundur))
		    (RP af$-af)
		    (VAN $hentur-henda)
		    (NP-OB1 (N-D hirðstjóra$-hirðstjóri) (D-D $num-hinn)))
	  (, ,-,)
	  (CONJP (IP-MAT=1 (HAN hafður-hafa) (RP fram-fram)))
	  (CONJP (CONJ og-og)
		 (IP-MAT=1 (VAN settur-setja)
			   (PP (P í-í)
			       (NP (NPR-A Bláturn-bláturn)
				   (, ,-,)
				   (NP-PRN (ADJ-A almennilegt-almennilegur)
					   (N-A fangelsi-fangelsi)
					   (PP (P í-í)
					       (NP (D-A þá-sá) (NS-A daga-dagur))))))
...
  (ID 1725.BISKUPASOGUR.NAR-REL,.807))

Active

skipta: svo mörgum dægrum skiptir 1650.illugi.1347 (is the dative an argument, cf. Það skiptir miklu máli --- is máli here NP-ADT or NP-OB1?)

Objects

Does sofa take a direct object? Or NP-TMP?

( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (VBPI sofa-sofa)
	  (RP af-af)
	  (NP-OB1 (N-A nótt$-nótt) (D-A $ina-hinn))
	  (. .-.))
  (ID 1400.GUNNAR.NAR-SAG,.710))

Expletives

ES not in the first place.

VBN rather than VAN

snúinn, horfinn, farinn, genginn (except in e.g. gatan var gengin), farinn (except in e.g. leiðin var farin), kominn, gróinn, fallinn, dottinn, dáinn, gufaður upp, aftursnúinn

NP-ADT or NP-OB*

ríða hesti

búnir konum, gulli búnir 1300.alexander.371

prýða (NP-ADT or NP-OB):

					 (PP (P 0)
					     (NP (PRO-D því-það)
						 (CP-THT-SPE-PRN (C 0)
								 (IP-SUB-SPE (NP-SBJ (PRO-N hann-hann))
									     (BEPI er-vera)
									     (" "-")
									     (, ,-,)
									     (IP-MAT-PRN (VBPI segir-segja)
											 (NP-SBJ (NPR-N Þorsteinn-þorsteinn)))
									     (, ,-,)
									     (" "-")
									     (PP (P umfram-umfram)
										 (NP (Q-A alla-allur) (OTHERS-A aðra-annar)))
									     (VAN prýddur-prýða)
									     (NP-OB1 (N-D hefð-hefð) (CONJ og-og) (N-D heiðri-heiður) (, ,-,) (N-D speki-speki) (CONJ og-og) (N-D vísdómi-vísdómur) (, ,-,) (N-D heill-heill) (CONJ og-og) (N-D hamingju-hamingja))))))))))
	  (. ,-,))
  (ID 1675.ARMANN.NAR-FIC,119.971))

kynda (NP-ADT or NP-OB):

( (IP-MAT (ADVP (ADV Svo-svo))
	  (BEPI er-vera)
	  (VAN sagt-segja)
	  (CP-THT-SBJ (C 0)
		      (IP-SUB (IP-SUB-1 (NP-SBJ (PRO-N hann-hann))
					(HVPS hafi-hafa)
					(VBN lagt-leggja)
					(NP-OB1 (N-A eld-eldur))
					(PP (P í-í)
					    (NP (NP-POS (N-G baðstofu-baðstofa))
						(N-A ón-ón)
						(NP-POS (PRO-A sinn-sinn)))))
			      (CONJP (CONJ og-og)
				     (IP-SUB=1 (VAN kynt-kynda)
					       (ADVP-LOC (ADV þar-þar))
					       (NP-OB1 (NS-D hríslum-hrísla) (Q-D nokkrum-nokkur))))))
	  (. ,-,))
  (ID 1675.MAGNUS.BIO-OTH,.73))

gilda

Það gildir einu
(e.g. in Vidalin)

gæða

								(CONJP (CONJ og-og)
								       (IP-SUB=4 (BE vera-vera)
										 (VAN gæddur-gæða)
										 (NP-OB1 (ADV nálega-nálega) (ADJ-D guðlegu-guðlegur) (N-D viti-vit))))))))))
		  (. .-.)
		  (CODE <P_57>)))
  (ID 1745.KLIM.NAR-FIC,57.556))
( (IP-MAT (NP-SBJ (PRO-N Hann-hann))
	  (BEPS sé-vera)
	  (NP-OB1 (Q-D mörgum-margur)
		  (NS-D gæðum-gæði)
		  (NP-PRN *ICH*-1))
	  (VAN gæddur-gæða)
	  (, ,-,)
	  (NP-PRN-1 (NP (N-D stöðuglyndi-stöðuglyndi)
			(CONJ og-og)
			(N-D sparsemi-sparsemi)
			(IP-INF-PRP (TO að-að)
				    (VB passa-passa)
				    (RP upp-upp)
				    (PP (P á-á)
					(NP (N-A heilsu-heilsa)
					    (NP-POS (PRO-A sína-sinn))))))
		    (CONJP (CONJ og-og)
			   (ADVP (ADV svo-svo))
			   (ADVP (ADV framvegis-framvegis))))
	  (. .-.))
  (ID 1791.JONSTEINGRIMS.BIO-AUT,150.1352))
Enginn-enginn verzlunarstjóri-verzlunarstjóri þar-þar hafði-hafa verið-vera
gæddur-gæða jafnvíðtækri-jafnvíðtækur þekkingu-þekking á-á þeim-sá hlutum-hlutur .-.
(1907.LEYSING.NAR-FIC,.876)
Stjórnendur-stjórnandi hennar-hún voru-vera ekki-ekki gæddir-gæða áhuga-áhuga Þorgeirs-þorgeir og-og ötulleik-ötulleikur .-.
(1907.LEYSING.NAR-FIC,.1225)

What is "liðsinnir" in the following?

( (IP-MAT (CONJ og-og)
	  (NP-SBJ *con*)
	  (VBDI kváðust-kveða)
	  (IP-INF (NP-SBJ (PRO-A það-það)
			  (CP-THT-PRN *ICH*-1))
		  (VBN spurt-spyrja)
		  (HV hafa-hafa)
		  (, ,-,)
		  (CP-THT-PRN-1 (C að-að)
				(IP-SUB (NP-SBJ (PRO-N þeir-hann)
						(NP-PRN (NPR-N Torfi-torfi) (CONJ og-og) (NPRS-N Hallkelssynir-hallkelsson)))
					(MDDS mundu-munu)
					(NP-OB1 (PRO-D honum-hann))
					(VAN liðsinnir-liðsinna)
					(PP (P um-um)
					    (NP (NS-A eftirmál$-eftirmáli)
						(D-A $in-hinn)
						(NP-POS (PRO-G þeirra-hann)
							(NP-PRN (NS-G feðga-feðgur))))))))
	  (. .-.))
  (ID 1830.HELLISMENN.NAR-SAG,.459))

stefna (stefna þeir honum orrustu; ector.1828) -- orrustu is now parsed as OB1.

NP-MSR or NP-OB*

kosta

Various inconsistencies and errors

VAN, VBN, VAG or ADJ? auðsýnt, krossaður, trúaður, yfirkominn, hálfruggandi, lifandi, yfirvegaður, auðvitað, auðvíst, fullkominn, áðurtöldu/áðurtalinn, unnt, svonefndur, troðinn, ákveðinn, viðkomandi

metast, teljast, kallast, gerast ...

þykja vænt um (see documentation in IP-SMC)

fyrirfram

svona as a modifier: ADJ, SUCH, or ADV(R)?

RRC idoms NP-SBJ | INTJP idoms NP-SBJ

samskonar

óvenju (as in óvenju framgang): is it N-G idominated by NP-MSR or ADJ and gets the same case as the noun it modifies?

Q exists

einu sinni 'even'

satt að segja

is til RP or P? ég vona til , að þú látir ekki honum Guðmundi mínum leiðast (1850.PILTUR.NAR-FIC,.1365)

ýmis --- Q, ADJ

í gær

fix smám saman

allra handa

IP-MAT=* idoms finite_verb

kring um: PP idoms PP ... um kring: PP idoms PP

til saman: RP ADVP or PP idoms ADVP?

nú meðan --- where ADVP-TMP nú idoms PP for some reason (georgius.490)

fyrrnefndur: ADJ / VAN

NP-PRD idoms only ADJ

Fix PP idoms IP-SUB|IP-IMP|IP-MAT

fýsa / eggja fararinnar, sometimes NP-ADT

PP recursion like í milli, á meðal ... sometimes PP idoms ADVP. (á meðan is PP idoms ADVP)

N21-A geld N22-D fé

fara erindis -- NP-DIR / NP-OB1

LATIN

frá ... til

á laun

þvert á móti

IP-SMC or ADJP-SPR? er hann sá borgina svo mjög hneigða til skurðgoðadýrkanar ntacts.1106

langt, lengst --- NP-MSR?

The subject of a gapped clause, when oblique and the previous clause has nominative subject and vice verssa, is sometimes parsed, sometimes not.

				(CP-CAR (WPP-3 (WADVP (WADV hvar-hvar))
					       (P fyrir-fyrir))
					(C 0)
					(IP-SUB (IP-SUB-4 (PP *T*-3)
							  (PP (P í-í)
							      (NP (NUM-A tvær-tveir) (NS-A reisur-reisa)))
							  (NP-SBJ (D-N þessi-þessi) (NPR-N Matthías-matthías) (NPR-N Davíðsson-davíðsson))
							  (RDDI varð-verða)
							  (PP (P í-í)
							      (NP (NPR-A Bláturn-bláturn)))
							  (RP inn$-inn)
							  (VAN $settur-setja))
						(CONJP (CONJ og-og)
						       (IP-SUB=4 (NP-SBJ *con*-D)
								 (VAN hótað-hóta)
								 (NP-OB1 (N-D líftjóni-líftjón))
								 (PP (P þó-þó)
								     (CP-ADV (C 0)
									     (IP-SUB (NP-SBJ *pro*)
										     (VAN náðaður-náða)
										     (RDDS yrði-verða))))))))))
	  (. .-.))
  (ID 1661.INDIAFARI.BIO-TRA,57.842))

Það fyrst as in:

Það fyrst að þér megi þetta ekki í hug vera er þú ert fulltíða. (1400.viglundur.352)
En það hið þriðja að fyrir má bíta að ég sé mín eigi ráðandi (1400.viglundur.356)

VAN|VB idoms RP

allt saman

OTHER+WPRO-N (annaðhvort) or OTHER+WPRO

megi in subjunctive or indicative?

megin (as in hinumegin (hinum megin) -- dative? NP-ADV?

I have been fixing NP-ADV nokkuð to NP-MSR in some places, as in Er ég það nokkuð (nökkuð), án þess hann gæti nokkuð áttað sig

PP idoms PRO

klukkan tíu

Predicate idoms quantifier (Q-*) -- is this ADJP or NP-PRD?

aftur -- bare ADVP or either ADVP-DIR or ADVP-TMP (depending on the context)

Eiga einhverjum eitthvað að þakka (CP-EOP sometimes, as in 1835.jonasedli.77)

CP-REL þar sem -- either WADV or ADV

IP-INF* idoms BE (heyrist honum vera gengið inn í skemmuna - 1850.piltur.1148; hann sagðist vera ...)

samlaga sig þeim: sig should be NP-OB1 and þeim NP-OB2, cf. Joel's answer in issue #313: "If "samlaga" is like English "assimilate" or "adapt", then "sig" should be NP-OB1 and þeim should be NP-OB2. It would then be parallel to the English".

giftast (hún giftist honum): is honum NP-OB1 or NP-OB2?

FP idoms nema: inconsistency whether it is on the clause level or within a constituent (NP*, PP* ...). The latter is probably the right way to do it.

NP-OB1 or NP-OB2: samtengja

öðru vísi vs. öðruvísi

P idoms en: clause level er within an NP?

P idoms nema: clause level er within an NP? (öllum ... var játað friði nema sex sturlunga.1147)

Að nafni expressions (að viðurnefni)

utanlands eða innan (I think the following is not correctly parsed):

(NP-ADV (N-G utanlands-utanlands)
        (CONJ eða-eða)
	(ADV innan-innan)))))

meira að segja

vera búinn að

þykjast (with a nominative subject)

subject of fylgja

object of sitja

bæði sakir ... og -- does P 0 precede bæði or vice versa?

heilagur in heilagur andi is sometimes tagged NPR, sometimes ADJ. Which is right?

á brottu

The use of RPX. In YCOE, they seem to use P on the clause level (http://www-users.york.ac.uk/~lang22/YCOE/doc/annotation/YcoePos.htm#adverbs). Is that ever done in our corpus?

að bak(i), á bak ...

NP-ADT or NP-OB1? of krækja (hramminum), fylkja liði

fyrir einum til tveimur áratugum

Additional checks

Sanity checks

1. CP-THT idoms C idoms sem

2. NP-POS idoms NP-POS, CONJP idoms NP-POS

3. IP*PRN idoms NP-SBJ idoms con

4. (ADJP* idomsonly {1}ADV|ADVR|ADVS)

5. CP* idoms NP|CONJ; PP idoms P hasSister CONJP

6. ADV* idoms *-meira|*-nokkuð|*-nokkur ... (e.g. in homiliubok.108)

7. NP-MSR that might be NP-PRD (1450.vilhjalmur.2311)

8. CONJP idoms C

9. Update bad-hver2.q (search for the lemma, not hver*|HVER*|Hver*)

10. CP* idoms !IP*

11. bad-ich-trace.q is (CP* iDoms W*) AND (W* sameIndex \*ICH\**); but we could also search for (CP* iDoms W*) AND (W* sameIndex \*ICH\**)

12. ip-inf3.q could be: IP-INF* idoms finite_verb

13. NP* idoms verb

14. NP* idoms CP-THT|CP-THT-SPE

15. ADJP idoms ADJ-* and ADJP idoms ADVP idomsonly ADV*

16. CP-DEG

( (IP-MAT (PP (P Að-að)
	      (NP (NS-D lyktum-lykta)))
	  (VBPI fá-fá)
	  (NP-SBJ (PRO-N þeir-hann))
	  (NP-OB1 (N-A veður-veður)
		  (QP (ADVR svo-svo) (Q-A mikið-mikill))
		  (, ,-,)
		  (CP-DEG (C að-að)
			  (IP-SUB (NEG ekki-ekki)
				  (VBPI megna-megna)
				  (NP-SBJ (PRO-N þeir-hann))
				  (IP-INF (PP (P við-við)
					      (NP (Q-A neitt-neinn)))
					  (TO að-að)
					  (VB ráða-ráða)))))
	  (. .-.))
  (ID 1650.ILLUGI.NAR-SAG,.1345))

17. IP-INF-PRN

18. miklu not NP-MSR where it should be.

19. CP* idoms verb

Smaller queries

IP-INF-PRP idoms IP-INF-PRP

Conjoined IP-INFs should in general not be coindexed.

upp$ (and other RPs with $) idominated by ADV

PP idomsonly P

PP idoms !P|PP

PP idoms VB*

N hasSister N

NPR* idoms [Þþ]ví*

  • -G idoms herra-herra

NP*=* exists

Probably delete BE idoms * in many sentences

A few verbs (intransitives) that should take ADJP-SPR, not ADJP predicate: falla, deyja

Fyrir ofan (two PPs, taking accusative object) --- often ADV P or RP P idominated by PP (fyrir sunnan ...)

sín í milli where sín is tagged nominative, not genitive

									    (PP (P fyrir-fyrir)
										(ADJP (PP (P austan-austan)
											  (NP (PRO-A sig-sig)))
										      (CONJP (CONJ og-og)
											     (ADVP (ADV norðan-norðan)))))))))

For some reason, 410 and 494 in 1150.homilibok were parsed like below (note that there is no CP-CMP there). This has now been fixed.

		      (IP-SUB (NP-SBJ (PRO-N vér-ég))
			      (MDPS viljum-vilja)
			      (VB kostgæfa-kostgæfa)
			      (IP-INF (TO að-að)
				      (VB vita-vita)
				      (NP-OB1 (CP-CMP (WADVP-1 0)
						      (C sem-sem)
						      (IP-SUB (ADVP *T*-1)
							      (NP-OB1 (QS-A flest-margur)
								      (PRO-A það-það)
								      (, ,-,)
								      (CP-REL (WNP-2 0)
									      (C er-er)
									      (IP-SUB (NP-SBJ *T*-2)
										      (ADJP (ADJR-N betra-góður)
											    (CP-EOP *ICH*-3)
											    (PP *ICH*-5))
										      (BEPI er-vera)
										      (CP-EOP-3 (WNP-4 0)
												(IP-INF (NP-SBJ *T*-4)
													(TO að-að)
													(VB vita-vita)))
										      (PP-5 (P en-en)
											    (IP-INF (PP (P án-án))
												    (TO að-að)
												    (BE vera-vera)))))))))))))
	  (, ,-,))
  (ID 1150.HOMILIUBOK.REL-SER,.494))

A few sentences that might need to be looked at

1. fyrstan in 1450.vilhjalmur.2239: hjó fyrstan þann kappa

2. CP-ADV in 1150.homiliubok.1708: is it CP-CMP since there is SUCH (slíkur leiðarvísir) in the clause?

3. engi vitni bera in arni.553

4. lífs (should probably be NP* idoms NP-POS idoms N-G idoms lífs)

5. Is CP-THT the subject here?

	  (VBDI heyrða-heyrða)
	  (NP-SBJ (PRO-N ég-ég))
	  (IP-PPL-OB1 (VAN getið-geta)
		      (PP (P eftir-eftir)
			  (NP (D-D þeim-það) (ADJ-D skyggnu-skyggnur)))
		      (CP-THT (C að-að)
			      (IP-SUB (ALSO líka-líka)
				      (HVDS hefði-hafa)
				      (VBN sést-sjá)
				      (ADVP-LOC (ADV þar-þar))
				      (NP-SBJ (NS-N merki-merki))
...
  (ID 1659.PISLARSAGA.BIO-AUT,.259))

6. VP

	  (IP-MAT-PRN (NP-SBJ (PRO-N það-það))
		      (BEPI er-vera)
		      (VP (VAN reifður-reifa)
			  (NP-OB1 (NS-D gjöfum-gjöf)
				  (NP-POS (ADJ-G margfaldrar-margfaldur) (N-G miskunnar-miskunn)))))
	  (. .-.))
  (ID 1150.HOMILIUBOK.REL-SER,.345))

7.

	  (IP-MAT-SPE (NP-SBJ (PRO-N það-það))
		      (BEPI er-vera)
		      (VP (VAN óblandnar-óblandnur)
			  (NP-ADT (N-D heimsskrauti-heimsskraut))))

...
  (ID 1150.HOMILIUBOK.REL-SER,.2007))