作者:捕鱼达人2602881157 | 来源:互联网 | 2023-10-13 18:29
我是Python的新手,我正在用它进行一个难看的将表数据转换成db的小转换.该程序查看数据,在MySQL中创建一个表,然后将数据读入表中.在本节中,将检查标题行文本以对数据类型做出
我是Python的新手,我正在用它进行一个难看的将表数据转换成db的小转换.该程序查看数据,在MySQL中创建一个表,然后将数据读入表中.在本节中,将检查标题行文本以对数据类型做出一些决定.我有个主意,我可以很聪明,并使用一个正则表达式而不是if / elifs.我的解决方案至少适用于这种情况,在这里我不必担心多个匹配项.我要问的是,这种方法在效率方面是否有真正的优点?
def _typeMe(self, header_txt):
# data typing
colspecs = {
'id':'SMALLINT(10)',
'date':'DATE',
'comments':'TEXT(4000)',
'flag':'BIT(1)',
'def':'VARCHAR(255)'
}
# regex to match on header text e.g. 'Provisioner ID'
r = re.search(re.compile('(ID$)|(Date)|(Comments$)|(FLAG$)', re.IGNORECASE), header_txt)
checktype = lambda m: max(m.groups()).lower() if m else 'def'
return colspecs[checktype(r)]
解决方法:
我同意@ecatmur的回答;我只想发布一些轻微的代码建议,这些建议太长了,无法发表评论.
无需执行re.search(re.compile(‘…’,re.IGNORECASE),header_text).相反,您可以直接将字符串作为re.search(‘…’,header_text,re.IGNORECASE)传入.如果您一遍又一遍地使用相同的正则表达式,则re.compile会更快,但如果您不使用re.search和朋友,它将为您调用它.
尽管我不同意Colin对命名为lambda的不屑(这很方便,因为它们仍然是一行而不是两行),但您根本不需要在这里使用内部函数:
return colspecs[max(m.groups()).lower() if m else 'def']
如果您只创建一个捕获组而不是四个捕获组,则也不需要max(m.groups())技巧:'(ID | Date | Comments | Flag)$’.然后,您可以执行m.group(1).