summaryrefslogtreecommitdiff
path: root/script/BuildLangModelLogs/LangGreekModel.log
blob: f81f77f3e3bd10c0cea218ab82d096e65d890a71 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
= Logs of language model for Greek (el) =

- Generated by BuildLangModel.py
- Started: 2022-12-14 23:56:52.996274
- Maximum depth: 4
- Max number of pages: 200

== Parsed pages ==

Πύλη:Κύρια (revision 9720674)
Θάνατος της Μάχσα Αμίνι (revision 9785479)
Ιράκ (revision 9784253)
5ος αιώνας π.Χ. (revision 9503435)
1960 (revision 9026602)
4ος αιώνας π.Χ. (revision 9500049)
Σάντα Μαρία ντελ Πόπολο (revision 9813223)
Ρίσι Σούνακ (revision 9807035)
Γαλλία (revision 9809487)
Γενικός Γραμματέας του Κομμουνιστικού Κόμματος της Κίνας (revision 9790632)
Ολυμπιακοί Αγώνες (revision 9767748)
Αμπέμπε Μπικίλα (revision 9629134)
Κεντρική Αμερική (revision 9436648)
Ζήνων ο Ελεάτης (revision 9687689)
25 Απριλίου (revision 9528548)
Ιαπωνία (revision 9738909)
Η Σταύρωση του Αγίου Πέτρου (revision 8027915)
Δόλιχος (revision 9642281)
Κατάρ (revision 9777831)
Καραϊβική (revision 9776894)
Πρωτεύουσα της Γαλλίας (revision 9694896)
16 Οκτωβρίου (revision 9719896)
Επισκοπή της Ρώμης (revision 8247187)
8ος αιώνας π.Χ. (revision 9509177)
1516 (revision 8891470)
Συριακή Ορθόδοξη Εκκλησία (revision 8814522)
Θεόφραστος (revision 9645199)
16 Σεπτεμβρίου (revision 9054145)
Ατλαντικός Ωκεανός (revision 9450595)
Ηνωμένο Βασίλειο (revision 9738607)
Καναδάς (revision 9736902)
Νότια Ασία (revision 9718470)
Άρθουρ Γουέλσλι, δούκας του Ουέλλινγκτον (revision 9810101)
Βιετνάμ (revision 9767839)
Μεροβίγγειοι (revision 9720122)
Ντομινίκ Γουίλκινς (revision 9798740)
BIBSYS (revision 9155553)
Γουατεμάλα (revision 9770327)
Αγγλική γλώσσα (revision 9779698)
Αρκτικός Ωκεανός (revision 9450607)
Αθλητισμός (revision 9816520)
Δυτική Ευρώπη (revision 9667409)
Αγγλία (revision 9730532)
Λεωτυχίδας ο Λακεδαιμόνιος (revision 9655599)
Καινή Διαθήκη (revision 9725581)
1660 (revision 7905687)
Ευρασία-Αφρική (revision 9667364)
Άμστερνταμ (revision 9701304)
Πολυνησία (revision 9667374)
Άρσης (revision 8381416)
Τασκένδη (revision 9674027)
Système universitaire de documentation (revision 9519040)
1964 (revision 9811809)
COVID-19 (revision 9751162)
Σεισμός (revision 9555986)
Μαρόκο (revision 9816451)
Ευρωπαϊκή Ένωση (revision 9807037)
Αρχαιοελληνική πυγμαχία (revision 9008193)
Άντονι Ήντεν (revision 9752041)
11 Αυγούστου (revision 8988727)
2006 (revision 9797947)
Κατάλογος καθιερωμένων όρων (revision 9747802)
Ρωσία (revision 9756811)
Μπιτς βόλεϊ (revision 9629816)
Αραβική γλώσσα (revision 9758388)
7ος αιώνας π.Χ. (revision 9509175)
International Standard Name Identifier (revision 6861942)
Ελευθερία, Ισότητα, Αδελφοσύνη (revision 8591437)
Συμβούλιο των Αντιπροσώπων του Ιράκ (revision 9812554)
Βιοεπιστήμες (revision 9175912)
21 Οκτωβρίου (revision 9123772)
Καμήλα (revision 9815157)
1526 (revision 7905955)
Μικτή οικονομία (revision 9756694)
Εμπραχίμ Ραΐσι (revision 9662244)
Βαθυσκάφος (revision 8755412)
Γιοχάνεσμπουργκ (revision 9234192)
Γιαζίντι (revision 9251594)
Πακιστάν (revision 9719399)
27 Νοεμβρίου (revision 9168386)
25 Οκτωβρίου (revision 9732587)
Ειρηνικός Ωκεανός (revision 9659005)
Βία κατά των γυναικών (revision 9404071)
Γιανίκ Νοά (revision 9721039)
Μεξικό (revision 9672139)
Ευρώπη (revision 9806540)
Ακκάδιοι (revision 8546428)
Είλωτες (revision 9472621)
Λεύκιππος (φιλόσοφος) (revision 8933581)
Δόλοπες (revision 9091900)
Ήλιος (revision 9797813)
Αντίς Αμπέμπα (revision 9703571)
4 Απριλίου (revision 9797052)
Μεγασθένης (revision 9397713)
Ισλαμική Συμβουλευτική Συνέλευση (revision 6895099)
Αμχαρική γλώσσα (revision 8252762)
Προφήτης Ιωνάς (revision 8981060)
Μεσοποταμία (revision 9478563)
Deutsche Welle (revision 9697594)
Θεοδόσιος Α' (revision 9717330)
Τανζανία (revision 9672789)
Μπαρόκ (revision 9498929)
Διαδηλώσεις στο Ιράν για το θάνατο της Μάχσα Αμίνι (revision 9746434)
Ρώμη (revision 9684590)
Εκκλησία (αρχιτεκτονική) (revision 9466423)
Integrated Authority File (revision 8518544)
Μπραζίλια (revision 9696231)
2η χιλιετία (revision 9650679)
Ιράν (revision 9804479)
Ολυμπιονίκης (revision 9767748)
The Guardian (revision 9533576)
Ανεξαρτησία (revision 9730220)
Σεισμός στο Αγκαντίρ (1960) (revision 9042146)
Γκέμπχαρντ Λέμπερεχτ φον Μπλύχερ (revision 9711616)
Αντρές Μανουέλ Λόπες Ομπραδόρ (revision 9591461)
Ηνωμένα Έθνη (revision 9596090)
Καρλομάγνος (revision 9776930)
Διάδης ο Πελλαίος (revision 8453992)
Ισλάμ (revision 9535017)
International Standard Serial Number (revision 9426410)
Πολ Βερλέν (revision 9620098)
Διεθνής πρότυπος αριθμός βιβλίου (revision 9525547)
Παντζάμποι (revision 9410265)
Θερινοί Ολυμπιακοί Αγώνες 2004 (revision 9646436)
Κεντρική Αφρική (revision 9666820)
1695 (revision 7905645)
1841 (revision 9476734)
Καράτζ (revision 7678423)
Αρχιτεκτονική (revision 9699724)
Κάλι Γιούγκα (revision 9173397)
Νέπιντο (revision 9786205)
Ησαΐας (revision 9285628)
Μιγκέλ Ιδάλγο ι Κοστίγια (revision 6788184)
Λατινικά (revision 9751029)
Ριγιάλ του Κατάρ (revision 9194726)
Καπιταλισμός (revision 9353276)
Σύστημα ταξινόμησης βιβλιοθήκης (revision 9648804)
Εκαταίος ο Μιλήσιος (revision 9332195)
Χαντίθ (revision 9423173)
24 Οκτωβρίου (revision 9123843)
Ατρείδες (revision 9269517)
Νερό (revision 9799579)
Χριστιανισμός στην Συρία (revision 9504011)
Εθνική Βιβλιοθήκη της Ελλάδος (revision 9771951)
Οθωμανικός Στρατός (revision 8724392)
Κάτεγατ (revision 9501508)
Βερμούδες (revision 9767755)
Floruit (revision 9328997)
Τρανσυλβανία (revision 9743855)
Κρυπτεία (revision 9689259)
Δημοκρατία της Ιρλανδίας (revision 9672626)
Κούρδοι (revision 9814315)
Οθέλλος (revision 9168875)
Κώμα (revision 7363577)
Συρία (revision 9703382)
Ευρασία (revision 9667362)
Θάλασσα του Σολομώντα (revision 9466850)
Πόλη του Μεξικού (revision 9692487)
Σημιτικές γλώσσες (revision 9595481)
Ισραήλ (revision 9777728)
Ναβουχοδονόσορ Β' (revision 9785243)
Αρδέννες (revision 9438776)
Λοτζ (revision 9812741)
Παρθένοι Νήσοι (revision 9466868)
Κεντρική Ευρώπη (revision 9712626)
Λάπις λάζουλι (revision 9356278)
Πόλεμος του Έβδομου Συνασπισμού (revision 9526274)
Βέλγιο (revision 9785761)
Γκιμαράες (revision 9256928)
Σπονδυλική στήλη (revision 9772196)
Κομμούνα του Παρισιού (Γαλλική επανάσταση) (revision 8737961)
Κοινοπολιτεία των Εθνών (revision 9713895)
Τηλεμετρία (revision 9300418)
Β΄ Παγκόσμιος Πόλεμος (revision 9796929)
Σουηδία (revision 9724663)

== End of Parsed pages ==

- Wikipedia parsing ended at: 2022-12-15 00:00:15.230612

63 characters appeared 1687423 times.

Most Frequent characters:
[ 0] Char α: 9.291090615690315 %
[ 1] Char ο: 8.043092929277366 %
[ 2] Char τ: 7.9854310389274055 %
[ 3] Char ι: 6.7272995567797755 %
[ 4] Char ν: 6.033816061532882 %
[ 5] Char ε: 5.973842954611855 %
[ 6] Char ρ: 4.455077357603873 %
[ 7] Char σ: 4.30638909153188 %
[ 8] Char κ: 4.299455441818679 %
[ 9] Char η: 3.817951989513003 %
[10] Char ς: 3.5992160827486646 %
[11] Char π: 3.4671804283810284 %
[12] Char μ: 3.293483613770821 %
[13] Char υ: 3.188708462549106 %
[14] Char λ: 2.825551151074745 %
[15] Char ί: 2.374330562046387 %
[16] Char ό: 1.996061449915048 %
[17] Char ά: 1.9162948472315477 %
[18] Char γ: 1.7252935393200164 %
[19] Char έ: 1.6340893777079015 %
[20] Char δ: 1.4231167881438145 %
[21] Char ω: 1.3993527408361743 %
[22] Char ή: 1.3272309314262043 %
[23] Char χ: 1.1665717487553506 %
[24] Char ύ: 1.0015271807958053 %
[25] Char θ: 0.9180863363839417 %
[26] Char β: 0.8104666109209131 %
[27] Char ώ: 0.779828175863432 %
[28] Char φ: 0.699231905692882 %
[29] Char ξ: 0.37246143972199025 %
[30] Char ζ: 0.29607276895004986 %
[31] Char e: 0.2829166130839748 %
[32] Char a: 0.25891551792289186 %
[33] Char i: 0.21506166503597496 %
[34] Char n: 0.19153466558177767 %
[35] Char r: 0.19141614165505627 %
[36] Char o: 0.18294168089447638 %
[37] Char s: 0.17677843670496374 %
[38] Char t: 0.15899984769675415 %
[39] Char l: 0.12883550834615862 %
[40] Char c: 0.10969389418065299 %
[41] Char d: 0.10281950643081196 %
[42] Char ψ: 0.09772297758179188 %

The first 43 characters have an accumulated ratio of 0.9924523963463813.
The first 6 characters have an accumulated ratio of 0.440545731568196.
All characters whose order is over 27 have an accumulated ratio of 0.03465402569480207.

1515 sequences found.

First 852 (typical positive ratio): 0.9950198012242328
Next 229 (1081-852): 0.003981133733535591
Rest: 0.0009990650422315728

- Processing end: 2022-12-15 00:00:15.353968