Derlem Dilbilimi ile Makine Çevirisinin Tarihsel Gelişimi: Çeviribilimsel Bir İnceleme The Historical Development of Corpus Linguistics and Machine Translation: A Translation Studies Perspective

Main Article Content

Giray FİDAN
Alper ÇALIK

Özet

Teknolojik gelişmeler, diğer birçok alanda olduğu gibi çeviri alanında da köklü dönüşümlere yol açmıştır. Özellikle 1990’lı yıllardan itibaren bilgisayarlara erişimin yaygınlaşmasıyla birlikte bilgisayar destekli çeviri (BDÇ) araçları ve makine çevirisi sistemleri çeviri pratiğinde giderek daha görünür ve yaygın hâle gelmiştir. Günümüzde ise geleneksel çeviri anlayışı büyük ölçüde, nöral makine çevirisi (NMT) motorları ve büyük dil modelleri (Large Language Models, LLMs) tarafından üretilen çıktılar üzerinde yapılan düzenleme ve son okuma süreçlerine evrilmiştir. Bu dönüşümde özellikle Google’ın 2016 yılında nöral makine çevirisi sistemini kullanıma sunması önemli bir dönüm noktası olmuş; sonrasında yapay zekâ tabanlı sistemlerin hızla yaygınlaşmasıyla bu teknolojik etki daha da belirgin hâle gelmiştir. Bu doğrultuda, özelleştirilmiş makine çevirisi motorları ve büyük dil modelleri üzerine yürütülen çalışmalar giderek artan bir önem kazanmıştır. Söz konusu sistemlerin temelinde yer alan en kritik unsur ise veridir; özellikle paralel derlemler (çift dilli corpuslar), bu sistemlerin eğitilmesi, özelleştirilmesi ve çıktı kalitesinin artırılmasında vazgeçilmez bir bileşen hâline gelmiştir. Geçmişte daha çok betimleyici ve kuramsal dilbilim çalışmaları için oluşturulan derlemler, günümüzde teknolojik gelişmelerle bütünleşerek nöral makine çevirisi motorları ve büyük dil modelleri için sistematik biçimde hazırlanmaktadır. Bu bağlamda, bu çalışmada derlemlerin tarihsel gelişimi, makine çevirisinin tarihsel süreç içerisindeki dönüşümü ve İngilizce–Türkçe derlem çalışmaları incelenmektedir.

Article Details

Nasıl Atıf Yapılır
FİDAN, G., & ÇALIK, A. (2025). Derlem Dilbilimi ile Makine Çevirisinin Tarihsel Gelişimi: Çeviribilimsel Bir İnceleme: The Historical Development of Corpus Linguistics and Machine Translation: A Translation Studies Perspective. Lisanî İlimler Dergisi, 3(2). https://doi.org/10.5281/zenodo.18033927
Bölüm
Makaleler

Referanslar

Aksan, Y., Aksan, M., Koltuksuz, A., Sezer, T., Mersinli, Ü., & Ufuk, U. (2012). Construction of the Turkish National Corpus (TNC).

Baker, M. (1993). Corpus linguistics and translation studies: Implications and applications. In M. Baker, G. Francis, & E. Tognini-Bonelli (Eds.), Text and technology: In honour of John Sinclair (pp. 233–250). John Benjamins.

Baker, M. (1996). Corpus-based translation studies: The challenges that lie ahead. John Benjamins.

Baker, M. (2000). Towards a methodology for investigating the style of a literary translator. Target, 12(2), 241–266.

Bauer, L. (1993). Manual of information to accompany the Wellington Corpus of Written New Zealand English. Victoria University of Wellington.

Biber, D. (1993). Representativeness in corpus design. Literary and Linguistic Computing, 8(4), 243–257. https://doi.org/10.1093/llc/8.4.243

Biber, D., Conrad, S., & Reppen, R. (1998). Corpus linguistics: Investigating language structure and use. Cambridge University Press.

Blackwell, S. (1993). From dirty data to clean language. In J. Aarts et al. (Eds.), English corpus linguistics (pp. 97–106).

Collins, P. (1991). Cleft and pseudo-cleft constructions in English. Routledge.

Crowdy, S. (1993). Spoken corpus design. Literary and Linguistic Computing, 8(4), 259–265.

Francis, W. N., & Kučera, H. (1964). Manual of information to accompany a standard corpus of present-day edited American English, for use with digital computers. Brown University.

Francis, W. N., & Kučera, H. (1967). Computational analysis of present-day American English. Brown University Press.

Francis, W. N., & Kučera, H. (1982). Frequency analysis of English usage: Lexicon and grammar. Houghton Mifflin.

Granger, S. (2003). The corpus approach: A common way forward for contrastive linguistics and translation studies. In S. Granger, J. Lerot, & S. Petch-Tyson (Eds.), Corpus-based approaches to contrastive linguistics and translation studies (pp. 17–29). Rodopi.

Greenbaum, S. (1991). The development of the International Corpus of English. In K. Aijmer & B. Altenberg (Eds.), English corpus linguistics (pp. 83–91). Longman.

Greenbaum, S. (Ed.). (1996). Comparing English worldwide: The International Corpus of English. Clarendon Press.

Greenbaum, S., & Svartvik, J. (1990). The London–Lund Corpus of Spoken English. Lund University Press.

Hutchins, W. J., & Somers, H. L. (1992). An introduction to machine translation. Academic Press.

Johansson, S. (1980). Some aspects of the vocabulary of learned and scientific English. In S. Greenbaum, G. Leech, & J. Svartvik (Eds.), Studies in English linguistics for Randolph Quirk (pp. 123–147). Longman.

Johansson, S., Leech, G., & Goodluck, H. (1978). Manual of information to accompany the Lancaster–Oslo/Bergen Corpus of British English. Norwegian Computing Centre for the Humanities.

Kennedy, G. (1998). An introduction to corpus linguistics. Longman.

Koehn, P. (2010). Statistical machine translation. Cambridge University Press. https://doi.org/10.1017/CBO9780511815829

Laviosa, S. (2002). Corpus-based translation studies: Theory, findings, applications. Rodopi.

Leech, G. (1991). The state of the art in corpus linguistics. In K. Aijmer & B. Altenberg (Eds.), English corpus linguistics: Studies in honour of Jan Svartvik (pp. 8–29). Longman.

McEnery, T., & Hardie, A. (2012). Corpus linguistics: Method, theory and practice. Cambridge University Press. https://doi.org/10.1017/CBO9780511981395

McEnery, T., & Wilson, A. (2001). Corpus linguistics: An introduction (2nd ed.). Edinburgh University Press.

Nivre, J., de Marneffe, M.-C., Ginter, F., Goldberg, Y., Hajic, J., Manning, C. D., … Zeman, D. (2016). Universal Dependencies v1: A multilingual treebank collection. Proceedings of LREC 2016, 1659–1666.

O’Brien, S. (2012). Translation as human–computer interaction. Translation Spaces, 1(1), 101–122. https://doi.org/10.1075/ts.1.06obr

O’Brien, S., Balling, L. W., Carl, M., Simard, M., & Specia, L. (2014). Post-editing of machine translation: Processes and applications. Cambridge Scholars Publishing.

Oflazer, K. (1994). Two-level description of Turkish morphology. Literary and Linguistic Computing, 9(2), 137–148. https://doi.org/10.1093/llc/9.2.137

Renouf, A. (1987). Corpus development. In J. Sinclair (Ed.), Looking up (pp. 1–40). Collins ELT.

Quirk, R. (1968). The Survey of English Usage. In Essays on the English language: Medieval and modern (Chap. 7). Longman.

Sak, H., Güngör, T., & Saraçlar, M. (2008). Turkish language resources: Morphological parser, morphological disambiguator and web corpus. In Proceedings of the International Conference on Natural Language Processing (pp. 417–427). Springer.

Say, B., Zeyrek, D., Oflazer, K., & Özge, U. (2002). Development of a corpus and a treebank for present-day written Turkish. In Proceedings of the 11th International Conference of Turkish Linguistics (pp. 183–192).

Say, B., Zeyrek Bozşahin, D., Oflazer, K., & Özge, U. (2004). Development of a corpus and a treebank for present-day written Turkish. https://hdl.handle.net/11511/81526

Sezer, T. (2017). TS Corpus Project: An online Turkish dictionary and TS DIY corpus. European Journal of Language and Literature, 9, 18–24. https://doi.org/10.26417/ejls.v9i1.18

Shao, X., & Zhu, Y. (2025). The assistance role of LLMs and NMT in student translators’ Chinese–English post-editing. Journal of China Computer-Assisted Language Learning.

Sinclair, J. M. (1991). Corpus, concordance, collocation. Oxford University Press.

Summers, D. (1991). Longman/Lancaster English Language Corpus: Criteria and design. Longman.

Sulubacak, U., Gökırmak, M., Tyers, F., Çöltekin, Ç., Nivre, J., & Eryiğit, G. (2016). Universal dependencies for Turkish. In Proceedings of COLING 2016 (pp. 3444–3454).

Tiedemann, J. (2011). Bitext alignment. Morgan & Claypool. https://doi.org/10.2200/S00320ED1V01Y201102HLT014

Tiedemann, J. (2012). Parallel data, tools and interfaces in OPUS. Proceedings of LREC 2012, 2214–2218.

Toury, G. (1995). Descriptive translation studies and beyond. John Benjamins.

Türk, U., Atmaca, F., Özateş, Ş. B., Berk, G., Bedir, S. T., Köksal, A., Öztürk, B., Güngör, T., & Özgür, A. (2021). Resources for Turkish dependency parsing: Introducing the BOUN Treebank and the BoAT Annotation Tool. Language Resources and Evaluation, 1–49.

Wu, Y., Schuster, M., Chen, Z., Le, Q. V., Norouzi, M., Macherey, W., … Dean, J. (2016). Google’s neural machine translation system: Bridging the gap between human and machine translation. arXiv. https://arxiv.org/abs/1609.08144

Zanettin, F. (2012). Translation-driven corpora: Corpus resources in descriptive and applied translation studies. St. Jerome.

Zanettin, F., Bernardini, S., & Stewart, D. (Eds.). (2003). Corpora in translator education. St. Jerome.

Zeyrek, D., Demirşahin, I., Sevdik-Çallı, A., Bayezit, E., & Yücebaş, E. (2012). Development of a corpus and a treebank for present-day written Turkish. Proceedings of LREC 2012, 1057–1063