热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

MSSQLServer数据导入:行为规范

我最早使用的一个关系型DBMS就是MicrorimsR:Base4000.R:Base,与其PC竞争对手dBase不同的是,它是真正的关系型数据库管理系统,是在20世纪80年代初作为NASARIM(关系信息管理,RelationalInformationManagement)系统的一个PC版本开发出来的。而我最欣赏的

我最早使用的一个关系型DBMS就是 MicrorimsR:Base4000.R:Base,与其PC竞争对手dBase不同的是,它是真正的关系型数据库管理系统,是在20世纪80年代初作为NASARIM(关系信息管理,RelationalInformationManagement)系统的一个PC版本开发出来的。而我最欣赏的

  我最早使用的一个关系型DBMS就是 Microrim‘sR:Base4000.R:Base,与其PC竞争对手dBase不同的是,它是真正的关系型数据库管理系统,是在20世纪80年代初作为NASARIM(关系信息管理,RelationalInformationManagement)系统的一个PC版本开发出来的。而我最欣赏的功能之一是它允许用户在导入过程中查看示例数据。尽管像bcp、DTS、新的SQLServer2005集成服务这样的工具以及各种移植工具和向导已经将数据导入过程自动化到SQLServer之中,但这不意味着我们可以一劳永逸。本月,RonTalmage提供一些关于导入数据的非常好的常识性建议。

  SQLServerDBA(DatabaseAdministrator,数据库管理员)发现他们经常使用T-SQL导入和处理数据。为什么呢?因为一些数据传输需要技术成熟的SQL所具备的强大功能。最近我刚好完成了另一个数据导入的案例,该案例触动我汇编了一份供我使用的行为规范列表。

  确保将载入的原始数据暂存为varchar数据类型

  源自所谓的旧式系统的原始数据通常以文本格式传送,因此我首先总是将原始数据载入一个单独的暂存数据库。我从不尝试将数据直接载入一个成品数据库。

  我做的事情是将所有原始文本数据载入相应的原始表,表中的列为varchar数据类型。(DTS将自动完成该过程,这样很好。但是,DTS还会将列命名为COL001,因此您不用事先提供列名。)varchar的主要优点是它能够接收任何数据-甚至是“坏”数据。如果您尝试从一个没有对用户输入的数据进行严格检查的旧式系统加载数据,那么被忽略的数据或写入异常文件的数据可能比加载的数据还多,如果您不想冒这样的风险,除非接收每一个可能的值。将字符载入varchar数据类型的列则可以做到这一点。

  在暂存表/列名时不要使用非字母数字字符

  您可能无法控制在包含原始数据的表中如何对列进行初始命名,但是我会尝试修改可能包含空格或其他非常规字符的旧式列名。当列名或表名包含非字母数字的字符时,我们必须使用方括号或双引号对其进行分隔。这种代码不但编写起来比较困难,而且可读性较差。

  不要在列名中使用关键字

  源自旧式系统的数据通常包含能够破坏SQL查询的描述性列名。例如,房地产数据可能会包含一个名为KEY的列,它用来反映放置在待售房屋上的钥匙箱。然而,KEY也是T-SQL中的一个关键字(!),如果使用这样的列名,查询操作在直接引用该列名时将失败。因此,最终您必须用方括号或双引号分隔含有关键字的列名。

  确保使用正确的数据类型创建一个暂存表

  下一步是创建一个或多个额外的暂存表,这些表有“正确的”数据类型。我喜欢使暂存表和目标 OLTP(OnlineTransactionProcessing,联机事务处理)数据库中的目的表具有相同的列名。不管怎样,重要的是原始数据中每列的数据类型在载入暂存时都将执行检查并予以改正。在SQLServer表中找到坏数据比在加载失败的外部文件中找到坏数据容易得多。

  确保将新列添加到暂存表中

  当暂存数据没有相应的列时,您可以添加这些列,然后拆分或合并载入的数据。例如,即使目的表分解出街道名和门牌号,地址仍然可能作为一个简单的字符串载入暂存表。那么您可以在暂存表中添加街道名列和门牌号列,将旧式地址分解为两个列。这样做的优点是,原始数据与新拆分的数据并存,因此您能够通过比较列来测试脚本。

  确保使用本地副本来测试填充的产品数据

  当您准备好要插入暂存表的数据时,可以首先通过将其插入成品表的本地副本来测试这些数据。有时您只需清空表;有时,您必须填充表。

  确保保留产品约束

  在副表上总是保留产品约束。这样,您就能够测试暂存表数据满足这些约束的程度。这些约束包括NULL、默认值、检查、主键和外键约束。首先保证副表列上的NULL或NOTNULL属性与目标系统的相同,,然后再逐步检查其他所有约束。如果您的测试表明暂存数据插入过程满足所有约束,那么您距离成功就只有一步之遥了。

  确保在一个产品数据副本上测试

  虽然将导入数据插入空表将遇到很多潜在的问题,但是不会遇到所有的问题。在通过了所有之前的测试后,确保您将在一个目标数据或成品系统的副本(或至少是一个合理的子集)上测试导入。您能够接收的最终错误类型将由数据配置决定,而且这是此项测试能够检测到的。那么,您就能够在数据库副本中检查结果,甚至可能将应用程序重定向到该副本以便进一步测试和验证。【专栏作家TomMoreau补充说,“使用每日成品更新数据进行测试可以为数据移植做准备。如果原来的系统没有足够的约束而新系统有,那么坏数据将进入原来的系统并破坏您的移植。”-Ed.】

  如果导入过程至此通过了所有测试,那么您可能已经准备好进行导入数据了,或者至少可以将导入过程交给质量管理员(QA,QualityAssurance)了。

推荐阅读
  • 本文介绍了如何使用 PostgreSQL 的 `UPDATE ... FROM` 语法,通过映射表实现对多行记录进行高效的批量更新。这种方法不仅适用于单列更新,还支持多列的同时更新。 ... [详细]
  • PHP 编程疑难解析与知识点汇总
    本文详细解答了 PHP 编程中的常见问题,并提供了丰富的代码示例和解决方案,帮助开发者更好地理解和应用 PHP 知识。 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 本文详细介绍了HTML中标签的使用方法和作用。通过具体示例,解释了如何利用标签为网页中的缩写和简称提供完整解释,并探讨了其在提高可读性和搜索引擎优化方面的优势。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 使用C#开发SQL Server存储过程的指南
    本文介绍如何利用C#在SQL Server中创建存储过程,涵盖背景、步骤和应用场景,旨在帮助开发者更好地理解和应用这一技术。 ... [详细]
  • 本文探讨了适用于Spring Boot应用程序的Web版SQL管理工具,这些工具不仅支持H2数据库,还能够处理MySQL和Oracle等主流数据库的表结构修改。 ... [详细]
  • 本文详细介绍了如何通过多种编程语言(如PHP、JSP)实现网站与MySQL数据库的连接,包括创建数据库、表的基本操作,以及数据的读取和写入方法。 ... [详细]
  • 在当前众多持久层框架中,MyBatis(前身为iBatis)凭借其轻量级、易用性和对SQL的直接支持,成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]
  • 在使用 DataGridView 时,如果在当前单元格中输入内容但光标未移开,点击保存按钮后,输入的内容可能无法保存。只有当光标离开单元格后,才能成功保存数据。本文将探讨如何通过调用 DataGridView 的内置方法解决此问题。 ... [详细]
  • 本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤,用户可以在不同发行版(如 Ubuntu 和 Red Hat)上顺利完成 PostgreSQL 的安装。 ... [详细]
  • 如何在PostgreSQL中查看数据表
    本文将指导您使用pgAdmin工具连接到PostgreSQL数据库,并展示如何浏览和查找其中的数据表。通过简单的步骤,您可以轻松访问所需的表结构和数据。 ... [详细]
  • 利用存储过程构建年度日历表的详细指南
    本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示,帮助读者掌握存储过程的应用技巧,并提供详细的代码解析和执行步骤。 ... [详细]
  • 本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包,从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例,并解释了每个步骤的实现细节。 ... [详细]
author-avatar
拍友2502914703
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有