uchardet/uchardet - uchardet is an encoding detector library, which takes a sequence of bytes in an unknown character encoding and attempts to determine the encoding of the text. Returned encoding names are iconv-compatible. (mirrored from https://gitlab.freedesktop.org/uchardet/uchardet)

Age	Commit message (Expand)	Author	Files	Lines
2023-07-17	src: handle long sequences of characters.	Jehan	1	-10/+21
2023-07-17	Issue #33: crafted sequence of bytes triggers memory write past the bounds of…	Jehan	1	-2/+13
2022-12-20	script, src, test: new Georgian support.	Jehan	1	-0/+1
2022-12-20	script, src, test: adding Catalan support.	Jehan	1	-0/+1
2022-12-17	script, src, test: add Serbian support.	Jehan	1	-0/+1
2022-12-17	src, script: add Macedonian support.	Jehan	1	-0/+1
2022-12-17	script, src: regenerate Russian models and add UTF-8/Russian support.	Jehan	1	-0/+1
2022-12-17	script, src, test: add Ukrainian support.	Jehan	1	-0/+1
2022-12-17	script, src, test: adding Belarusian support.	Jehan	1	-0/+1
2022-12-17	script, src, test: Bulgarian language models added.	Jehan	1	-0/+1
2022-12-14	src: when checking for candidates, make sure we haven't any unprocessed…	Jehan	1	-1/+8
2022-12-14	src: process pending language data when we are going to pass buffer size.	Jehan	1	-0/+11
2022-12-14	script, src: update Norwegian model with the new language features.	Jehan	1	-0/+1
2022-12-14	script, src: add English language model.	Jehan	1	-0/+1
2022-12-14	script, src: remove generated statistics data for Korean.	Jehan	1	-1/+0
2022-12-14	src: new nsCJKDetector specifically Chinese/Japanese/Korean recognition.	Jehan	1	-1/+3
2022-12-14	src: add Hindi/UTF-8 support.	Jehan	1	-1/+2
2022-12-14	script, src: add generic Korean model.	Jehan	1	-0/+1
2022-12-14	src, test: fix the new Johab prober and add a test.	Jehan	1	-2/+2
2022-12-14	src: build new charset prober for Johab Korean.	Jehan	1	-1/+2
2022-12-14	add charset prober for Johab Korean	LSY	1	-1/+4
2022-12-14	script, src: generate the Hebrew models.	Jehan	1	-0/+1
2022-12-14	src: make nsMBCSGroupProber report all valid candidates.	Jehan	1	-61/+161
2022-12-14	src: allow for nsCharSetProber to return several candidates.	Jehan	1	-10/+10
2022-12-14	src: nsMBCSGroupProber confidence weighed by language confidence.	Jehan	1	-2/+16
2022-12-14	src: reset language detectors when resetting a nsMBCSGroupProber.	Jehan	1	-0/+6
2022-12-14	src, script: regenerate all existing language models.	Jehan	1	-6/+28
2022-12-14	Using the generic language detector in UTF-8 detection.	Jehan	1	-10/+99
2022-12-14	src: new API to get the detected language.	Jehan	1	-0/+12
2015-11-17	uchardet_get_charset() must return iconv-compatible names.	Jehan	1	-4/+4
2011-07-11	Update code from upstream.	BYVoid	1	-49/+70
2011-07-10	Initial release.	BYVoid	1	-0/+209