วันพฤหัสบดีที่ 2 สิงหาคม พ.ศ. 2550

แหล่งของคลังข้อมูลภาษา

3.1 สมัครเป็นสมาชิกของสำนักพิมพ์หรือหน่วยงานที่สร้างคลังข้อมูลของตัวเอง เช่น British National Corpus (http://www.natcorp.ox.ac.uk) ข้อดีคือคลังข้อมูลมีขนาดใหญ่และประกอบด้วยประเภทของข้อความที่หลากหลาย และมีโปรแกรมการวิเคราะห์คลังข้อมูลภาษาสำเร็จรูปที่ซับซ้อนเป็นส่วนหนึ่งของ package โดยที่ไม่ต้องหาซื้อโปรแกรมเพิ่มเติม แต่ส่วนใหญ่มักมีค่าใช้จ่ายสูงโดยเฉพาะสมาชิกประเภทสถาบันหรือหน่วยงาน

3.2 ใช้แหล่งข้อมูลจากเวปไซด์ (web conconcordancing) ข้อดีคือไม่มีค่าใช้จ่าย ไม่ต้องศึกษาการใช้โปรแกรมวิเคราะห์คลังข้อมูลภาษา ใช้งานง่าย คือ เข้าไปที่เวปไซด์ พิมพ์คำที่ต้องการสืบค้น เลือกคลังข้อมูล จากนั้นเวปไซด์ก็จะแสดงผลการสืบค้น หรือตัวอย่างของคำที่ต้องการทันที แต่มีข้อจำกัดคือคลังข้อมูลมักมีขนาดเล็ก จึงอาจไม่พบตัวอย่างของคำหรือพบตัวอย่างค่อนข้างน้อยถ้าเลือกหาคำที่ไม่ได้เป็นคำที่พบบ่อย คลังข้อมูลจากเวปไซด์ที่แนะนำ คือ

http://www.lextutor.ca/concordancers/concord_e.html (คลังข้อมูลภาษาทั่วไป) http://vlc.polyu.edu.hk/concordance/WWWConcappE.htm (คลังข้อมูลภาษาทั่วไป)
http://ysomeya.hp.infoseek.co.jp (เฉพาะคลังข้อมูลจดหมายธุรกิจ)
http://sara.natcorp.ox.ac.uk/lookup.html (คลังข้อมูลภาษาทั่วไป)
http://www.collins.co.uk/Corpus/CorpusSearch.aspx (คลังข้อมูลภาษาทั่วไป)

3.3 สร้างคลังข้อมูลภาษาขึ้นเองในกรณีที่ต้องการศึกษาลักษณะภาษาหรือศัพท์เฉพาะ เช่น ต้องการศึกษาลักษณะภาษาของบทความทางวิทยาศาสตร์ หรือต้องการทำศัพทานุกรมศัพท์เฉพาะเรื่องใดเรื่องหนึ่ง สามารถสร้างคลังข้อมูลเองได้โดยบันทึกข้อมูลภาษาที่ต้องการในรูปแบบของไฟล์ข้อมูล (text file) หรือไฟล์ที่มีนามสกุล .txt และใช้โปรแกรมวิเคราะห์คลังข้อมูลภาษาในการสืบค้นและแสดงผลข้อมูล ข้อดีของแหล่งข้อมูลประเภทนี้คือสามารถสร้างคลังข้อมูลภาษาได้ตามจุดประสงค์ แต่มีข้อเสียคือต้องหาโปรแกรมวิเคราะห์ข้อมูลภาษาเองและต้องใช้เวลาศึกษาการใช้งานโปรแกรมดังกล่าว อย่างไรก็ตามในปัจจุบันมีโปรแกรมที่มีประสิทธิภาพและราคาไม่แพง เช่น

‘Wordsmith’ (http://www.lexically.net/wordsmith)
monoconc (http://www.athel.com/mono.html)

หรือโปรแกรมที่อาจมีลักษณะการใช้งานที่จำกัดแต่ไม่เสียค่าใช้จ่ายซึ่งอาจเหมาะกับผู้ที่เริ่มทดลองใช้หรือทำงานวิจัยขนาดเล็ก เช่น

Antconc’ (http://www.antlab.sci.waseda.ac.jp/software.html )

ไม่มีความคิดเห็น: