Jonathan Reeve
@JonathanReeve
Infrastrukturoj kaj iloj por analizo de kulturo
Priskribo
Mi konstruas ilojn kaj infrastrukturojn por analizi, kolekti kaj manipuli tekstojn, tiel ke ni povas pli bone kompreni librojn kaj aliajn tekstajn kulturojn. Iuj el miaj lastatempaj projektoj inkludis Macro-Etym, ilo por analizi la etimologiojn de teksto; Teksto-Matcher, ilo pri detekto de reuzo de teksto, bona por identigi kiam teksto citas de alia; Corpus-DB, API por Projekto Gutenberg kaj aliaj tekstaj deponejoj; kaj Chapterize, ilo por dividi libron en ĝiajn ĉapitrojn. Mi ankaŭ gvidas la projekton Malferma-Eldonoj projekto, kiu celas produkti riĉe-komentitajn eldonojn de klasikaj literaturaj verkoj, kaj la Git-Lit projekto, kiu publikigas la ciferecajn librojn de la Brita Biblioteko tra GitHub.
Mi estas PhD-kandidato en la angla kaj kompara literaturo en Universitato Kolumbio, kie mi laboras en la Laboratorio pri Literatura Modelado kaj Bildigo de la Grupo por Eksperimentaj Metodoj en la Homaj Literoj. Nia grupo ne havas propran financadon, kaj mia financa studento estas tre modesta, do donacoj (de mono kaj / aŭ kodo) estas profunde estimataj.
[Legu pli pri mia laboro ĉi tie, sur mia retejo.](Http://jonreeve.com/).
Konektitaj Kontoj
JonathanReeve posedas la jenajn kontojn en aliaj servoj:
Deponejoj
text-matcher Steloj 120 Ĝisdatigita antaŭ 10 monatoj
A simple text reuse detection CLI tool.
corpus-db Steloj 57 Ĝisdatigita antaŭ 4 jaroj
A textual corpus database for the digital humanities.
late-style-PCA Steloj 10 Ĝisdatigita antaŭ 4 jaroj
An attempt to experimentally test Edward Said's claims about late style using computational text analysis and principal component analysis.
chapterize Steloj 82 Ĝisdatigita antaŭ 6 jaroj
A simple tool for splitting up an ebook into its chapters. Works well with Project Gutenberg texts. May also be used to clean up books for computational text analysis.
chapter-experiments Steloj 0 Ĝisdatigita antaŭ 6 jaroj
Quantitative analyses of novelistic chapters. Diachronic analyses of chapter lengths, numbers of chapters, linguistic patterns within chapters.
sentence-trees Steloj 1 Ĝisdatigita antaŭ 7 jaroj
Experiments with sentences as trees.
character-attribution Steloj 2 Ĝisdatigita antaŭ 7 jaroj
Probabilistic attribution of character voices in fiction.
allusion-detection Steloj 9 Ĝisdatigita antaŭ 8 jaroj
Computational intertextuality detection in Python. Fuzzy string matching, approximate string matching.
Historio
JonathanReeve aliĝis antaŭ 5 jaroj.