A multilingual colossal, cleaned version of Common Crawl’s web crawl corpus. Based on Common Crawl dataset: “https://commoncrawl.org”.
ชุมชนผู้สนใจการประมวลผลภาษาธรรมชาติ (natural language processing) ในภาษาไทย และแบ่งปันความรู้ตามแนวทางซอฟต์แวร์เสรีและข้อมูลเปิด มีงานพบปะแลกเปลี่ยนชื่อ Thai NLP Meetup ไม่เกี่ยวข้องกับบริษัทหรือสถาบันใด ๆ #ThaiNLP