# -*- coding: <utf-8> -*-
import re
conversiontable = { 'ॐ' : 'oṁ', 'ऀ' : 'ṁ', 'ँ' : 'ṃ', 'ं' : 'ṃ', 'ः' : 'ḥ', 'अ' : 'a', 'आ' : 'ā', 'इ' : 'i', 'ई' : 'ī', 'उ' : 'u', 'ऊ' : 'ū', 'ऋ' : 'r̥', 'ॠ' : ' r̥̄', 'ऌ' : 'l̥', 'ॡ' : ' l̥̄', 'ऍ' : 'ê', 'ऎ' : 'e', 'ए' : 'e', 'ऐ' : 'ai', 'ऑ' : 'ô', 'ऒ' : 'o', 'ओ' : 'o', 'औ' : 'au', 'ा' : 'ā', 'ि' : 'i', 'ी' : 'ī', 'ु' : 'u', 'ू' : 'ū', 'ृ' : 'r̥', 'ॄ' : ' r̥̄', 'ॢ' : 'l̥', 'ॣ' : ' l̥̄', 'ॅ' : 'ê', 'े' : 'e', 'ै' : 'ai', 'ॉ' : 'ô', 'ो' : 'o', 'ौ' : 'au', 'क़' : 'q', 'क' : 'k', 'ख़' : 'x', 'ख' : 'kh', 'ग़' : 'ġ', 'ग' : 'g', 'ॻ' : 'g', 'घ' : 'gh', 'ङ' : 'ṅ', 'च' : 'c', 'छ' : 'ch', 'ज़' : 'z', 'ज' : 'j', 'ॼ' : 'j', 'झ' : 'jh', 'ञ' : 'ñ', 'ट' : 'ṭ', 'ठ' : 'ṭh', 'ड़' : 'ṛ', 'ड' : 'ḍ', 'ॸ' : 'ḍ', 'ॾ' : 'd', 'ढ़' : 'ṛh', 'ढ' : 'ḍh', 'ण' : 'ṇ', 'त' : 't', 'थ' : 'th', 'द' : 'd', 'ध' : 'dh', 'न' : 'n', 'प' : 'p', 'फ़' : 'f', 'फ' : 'ph', 'ब' : 'b', 'ॿ' : 'b', 'भ' : 'bh', 'म' : 'm', 'य' : 'y', 'र' : 'r', 'ल' : 'l', 'ळ' : 'ḷ', 'व' : 'v', 'श' : 'ś', 'ष' : 'ṣ', 'स' : 's', 'ह' : 'h', 'ऽ' : '\'', '्' : '', '़' : '', '०' : '0', '१' : '1', '२' : '2', '३' : '3', '४' : '4', '५' : '5', '६' : '6', '७' : '7', '८' : '8', '९' : '9', 'ꣳ' : 'ṁ', '।' : '.', '॥' : '..', ' ' : ' ', }
consonants = '\u0915-\u0939\u0958-\u095F\u0978-\u097C\u097E-\u097F'
vowelsigns = '\u093E-\u094C\u093A-\u093B\u094E-\u094F\u0955-\u0957'
nukta = '\u093C'
virama = '\u094D'
devanagarichars = '\u0900-\u097F\u1CD0-\u1CFF\uA8E0-\uA8FF'我一直在尝试上述映射,以音译文本从拉丁语到Devanagari。我正在使用VS代码,它向我抛出编码错误“非UTF-8代码开始于文件中\xe0”.,但没有声明编码“。我试着把utf-8编码行放在代码的上方,但这行不通。
有人能解释一下为什么会发生这种情况吗?我该怎么做才能纠正呢?
发布于 2021-02-22 08:26:02
删除第一行。
它可能会让你和Python混淆。不是通过书写文件是UTF-8,它发生了。
您应该检查文件的编码。检查VS使用UTF-8作为您的文件。将编码设置在那里,并保存文件。所以现在python将把文件看作UTF-8。
如果您编写第一行,Python只是认为文件是UTF-8,而它不是,所以错误。您正在强迫Python将文件读入UTF-8。
如果删除第一行,您可能会有相同的错误(UTF-8是默认的,因此如果没有其他编码的强烈建议,它仍然可以将其解释为UTF-8,并给出相同的错误,另一方面,它可能试图找到编码)。
但是,如果您将UTF-8设置为文件的编码(在VS中,通常在任何代码编辑器中),那么该文件将被保存为UTF-8。
PS:如果这不是家庭作业,您可能需要阅读Unicode标准中关于Devaganari的章节:还有更多的特殊情况需要处理。也可能是关于音译的标准(或者仅仅是寻找一个库)。
https://stackoverflow.com/questions/66292959
复制相似问题