首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在MySQL中将文本字符串大量转换为具有关系的唯一in

如何在MySQL中将文本字符串大量转换为具有关系的唯一in
EN

Stack Overflow用户
提问于 2017-06-22 16:48:58
回答 1查看 40关注 0票数 1

我有一个正在处理的电影数据库,在开始使用php方面之前,我希望确保数据库是可靠的。

由于我有大量的导入数据从网上刮取,我的结果在专栏中的体裁和演员都是在文本字符串中。我希望将它们转换为唯一的I并创建关系表。

从本质上讲,现在的情况是:

电影表

电影ID -电影名称-类型-演员1-盗梦空间-科幻-莱昂纳多迪卡普里奥,艾伦佩奇

我想要的是:

电影表

电影ID -电影名称1-盗梦空间

体裁表

体裁ID -体裁名称1- Sci Fi

演员表

演员ID -演员名字1-莱昂纳多·迪卡普里奥2-艾伦·佩奇

体裁关系表

电影ID -类型ID 1-1

演员关系表

电影ID -演员ID 1-1 1-2

如果只是类型,那么我可以手工完成,但由于有成千上万的电影和演员,我正在努力想出一个简单的方法来转换所有这些数据。

我有一个csv转储的所有数据,并认为它可以通过使用php脚本导入它的这种格式,或者我不知道是否可以运行SQL命令,以这种方式排序数据(数据库有超过20万部电影)。

任何提示或想法,如何完成这一点,将是非常感谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-06-22 18:22:18

像这样的东西会起作用的:

代码语言:javascript
复制
For each record
    Do 
       Select from genre table using genre string to get genre ID
       If select did not return ID, INSERT new genre string to add new genre ID
    While Select did not return ID
    For each actor
       Do 
         Select from genre table using actor string to get actor ID
         If select did not return ID, INSERT new actor string to add new actor ID
       While Select did not return ID
  ...

但也会有问题:

  • 同名电影
  • 体裁名称的不同拼写(科幻、科幻、科幻)
  • 演员名字的不同拼写。你会在IMDB中看到演员可能是Mike或Michael,有或没有中间的首字母,等等,女性可能在一些电影中使用自己的已婚姓名,而另一些则不使用。
  • 同名演员

要解决这个问题,您需要访问一些现有的数据库,在提供演员列表时,您可以为演员名称、类型名称和电影获得相同的ID代码。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44705226

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档