编程好比是一辆汽车,而数据结构和算法是汽车内部的变速箱。一个开车的人不懂变速箱的原理也是能开车的,同理一个不懂数据结构和算法的人也能编程。但如果开车的人懂变速箱的原理,爬坡使用1档可以获得更大牵引力。
编程好比是一辆汽车,而数据结构和算法是汽车内部的变速箱。一个开车的人不懂变速箱的原理也是能开车的,同理一个不懂数据结构和算法的人也能编程。但如果开车的人懂变速箱的原理,爬坡使用1档可以获得更大牵引力。
回到编程而言,比如将一个班级的学生名字要临时存储在内存中,你会选择什么数据结构来存储,数组还是ArrayList,或者HashSet,或者别的数据结构。如果不懂数据结构的,可能随便选择一个容器来存储,也能完成所有的功能,但是后期如果随着学生数据量的增多,随便选择的数据结构肯定会存在性能问题,而一个懂数据结构和算法的人,在实际编程中会选择适当的数据结构来解决相应的问题,会极大的提高程序的性能。
数据结构很重要。一些大师在进行编程之前在数据结构上花费的时间是非常多的。只有将数据结构设计好了,才能在此基础上使用算法。
接下来,介绍一下数组,链表,树,图,队列,栈相关的内容以及它们之间存在的一些关系。
数组这种数据结构有其随机访问的特点,靠下标就能访问。这种访问方式十分高效。
链表虽然不能利用下标访问,但对于内存的使用很具有灵活性,所以这个优点让它应用也十分广泛。因为在实际程序我们不能总是确定内存中有合适的空间。链表最大的作用感觉也在于此,其更适用于非随机访问的情况。
但是显然链表这种结构存在查找效率低的特点,这种问题应该如何解决呢?有没有一种办法既可以灵活分配内存,同时又能提高查找效率呢?(查找这个动作,往往是程序必不可少的一部分,几乎所有的程序都会涉及到查找这个动作,所以其效率便十分重要了)
先说一下总的方法,有序是查询得以优化的重要原因。先来说说树,树的组织一般也是链式存储的,好处就在于原来n个条目的数据存储在链表中,当我们进行查询时,查询第3个就必须经过第2个。查询第n个,就必须得经过前n-1个结点。那么问题来了,难道结点n前面的那些结点都需要经过吗?显然不是,这也说明了链表的局限性。相对而言,树的组织方式使我们在遍历时可以进行选择,比如说,二叉树中我们需要选定一个分支,相对而言,链表中我们没得选择。选择的出现带来了一定的优化。比如二叉排序树,堆等。这些树的构建,都是根据我们的目的来进行构建的。
栈,队列,则是由现实世界借鉴而来的。首先,现实世界中,队列栈这些形式普遍存在于现实生活中,而程序从某种角度是服务于现实生活中,所以就抽象出了计算机中的所谓栈,队列的概念。思想体现在程序的执行过程中,体现在程序开发设计中。事实上,栈,队列的思想不仅体现在了软件层面,计算机硬件层面也是很多地方应用了这中思想,比如指令队列(指令执行的先后顺序决定了队列适用于它),比如说寄存器栈(计算的次序决定了可以用栈来实现)。另外,函数调用机制也是栈的应用,a调用b,b调用c,这个过程在我们看来比较简单,但是在计算机中,在调用时则需要保存一系列信息,调用的过程以及返回的过程(c只能返回到b,不能直接返回到c)这个过程适合通过栈这种结构来进行模拟。
设计了好的数据结构,只是成功了一半,因为数据结构是静态的,只是组织数据的一种方式,你不去操作它(如访问),它是无法发挥它的作用的。所以,我们需要在此基础上去根据我们的目的进行相应的操作,而操作的方式不同,耗费的时间也是不一样的,我们需要找到好的操作方案。这里所说的方案,就是算法。
举一个简单的例子,你打算从家到学校,有多个公交可以坐,可以产生很多方案,每一种方案都是你对于达成目标的一种设计,我们称之为算法。人们往往会在众多方案中寻找优异的算法。我们这里的方案的数量是有限的,但是事实上,很多问题的方案是无限的,或者巨大的,我们无法一一去尝试这些方案。所以我们总结了一些优异算法的准则,思想,比如说贪心算法,动态规划等思想。
算法为何依赖于数据结构呢?为回答这个问题,举一个通俗的例子。你在学校捡到了一张饭卡,上面有姓名,学院,班级。然后你要去将饭卡还给失主。接下来,你会找到其学院,然后找到班级,然后在班级中通过询问同学找到失主。(姓名,学院,班级)在这里我们认为是数据结构,因其把这些数据组织到一张卡上了。接下来,想象另一种情形,假如说饭卡上只有姓名,而学院,班级在另一张信息卡上。那么你可能找遍全校也找不到失主。
将一些数据组织在一起,能够为算法提供必要的基础信息,关联信息,使得算法在执行过程中能够快速找到相关信息(比如,上面例子中的学院,班级)。
延伸阅读:
①、有穷性:对于任意一组合法输入值,在执行又穷步骤之后一定能结束,即:算法中的每个步骤都能在有限时间内完成。
②、确定性:在每种情况下所应执行的操作,在算法中都有确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下,算法都只有一条执行路径。
③、可行性:算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之。
④、有输入:作为算法加工对象的量值,通常体现在算法当中的一组变量。有些输入量需要在算法执行的过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中。
⑤、有输出:它是一组与“输入”有确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法功能。
最后建议,企业在引入信息化系统初期,切记要合理有效地运用好工具,这样一来不仅可以让公司业务高效地运行,还能最大程度保证团队目标的达成。同时还能大幅缩短系统开发和部署的时间成本。特别是有特定需求功能需要定制化的企业,可以采用我们公司自研的企业级低代码平台:织信Informat。 织信平台基于数据模型优先的设计理念,提供大量标准化的组件,内置AI助手、组件设计器、自动化(图形化编程)、脚本、工作流引擎(BPMN2.0)、自定义API、表单设计器、权限、仪表盘等功能,能帮助企业构建高度复杂核心的数字化系统。如ERP、MES、CRM、PLM、SCM、WMS、项目管理、流程管理等多个应用场景,全面助力企业落地国产化/信息化/数字化转型战略目标。 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们微信:Informat_5 处理,核实后本网站将在24小时内删除。版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系邮箱:hopper@cornerstone365.cn 处理,核实后本网站将在24小时内删除。