可以接受的是,在int列上搜索表比在字符串列上更快(比如varchar).
但是,如果我有一个带有Color列的Shirt表,那么创建一个Color表是否更高效,而该表上的主键是Shirt表上的外键?在搜索绿色衬衫时,联接是否会否定在Shirt上的Color列中的值为int而不是字符串值(如“Green”)的性能优势?
解决方法
与正在执行的其他操作相比,两种方法之间不太可能存在太多性能差异.如果您只有少量颜色(最多几百个),则颜色表适合大多数数据库中的单个页面.颜色索引会使查找速度非常快,并且不会产生任何I / O活动(在第一次加载页面之后).
字符串比较取决于数据库,但它确实涉及一个函数并从页面读取数据.所以,它不是免费的.当然,不同的数据库可能对字符串函数具有不同的性能特征.
应该存储的位置应该是您的应用程序的功能.假设您有一个应用程序,其中颜色将呈现给用户.有一天,您可能希望以西班牙语,斯瓦希里语或中文显示颜色的名称.如果是这样,拥有一个单独的表使这种国际化更容易.更平凡的是,您可能希望阻止输入“Grene”,如果是这样,拥有这样的表会使选择列表更容易.
另一方面,如果表现是你唯一关注的问题,那就不会有所不同.在其他情况下,查找表实际上可能比非规范化表更快.当字符串很长时会发生这种情况,从而增加了较大表中每条记录的长度.较大的表意味着更多的页面,这需要更长的时间来加载到内存中.