数据结构与算法1:引入概念

这篇具有很好参考价值的文章主要介绍了数据结构与算法1:引入概念。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

接下来系统的学一下数据结构与算法的知识,本章节是第一部分:数据结构与算法的进入与基本概述

第一章:引入概念

【铁打的算法demo】

先来看到题:

如果 a + b + c = 1000,且 a2 + b2 = c2(a, b , c 为⾃然数),如何求出所有 a、b、c 可能的组合?

方法一:直接干

思路:既然 a + b + c = 1000,说明 a、b、c 都在 0 ~ 1000 之内(不考虑负数),则可以用 for 循环 + if 直接写代码

# 导入time,用来计时运行程序所耗时间
import time

start = time.time()

for a in range(1000):
    for b in range(1000):
        for c in range(1000):
            if a ** 2 + b ** 2 == c ** 2 and a + b + c == 1000:
                print('a, b, c:%d, %d, %d' % (a, b, c))

end = time.time()
print('耗时:%fs.'.format(end - start))

运行结果:

a, b, c:0, 500, 500
a, b, c:200, 375, 425
a, b, c:375, 200, 425
a, b, c:500, 0, 500
耗时:251.520628s.
方法二:想想如何优化代码

优化一:优化 b 的 for 循环 for b in range(1000 - a)

  • a b 都在 0 ~ 1000 之内,a 循环范围是 0 ~ 1000,则循环 b 时可在此基础上用 1000 - a 即可,没必要再从 0 到 1000 循环一遍,因为 a b c 三者之和才只有 1000,如果 a = 500,循环到 b >= 500 时,会在后面判断 a ** 2 + b ** 2 == c ** 2 时被过滤掉(从结果看 c 也不能是 0,不符合逻辑),从而造成多余的没必要的循环,白白浪费资源,还拉长运行时间

优化二:优化 c 去掉for循环,改为 1000 - a - b

  • 一共三个数,在循环两个数后,第三个数就是 1000 减掉前两个数,相比于再 for 循环一遍,使用它们共同的和减掉前两个数得到第三个数的方式更简单,且是由 1000 的量级直接降到一个简单的减法了,还省去了后续的一个 if 判断

优化后的代码:

import time

start = time.time()

for a in range(1000):
    for b in range(1000):
        c = 1000 - a - b
        if a ** 2 + b ** 2 == c ** 2:
            print('a, b, c:%d, %d, %d' % (a, b, c))

end = time.time()

print('耗时:%fs.' % (end - start))

运行结果:

a, b, c:0, 500, 500
a, b, c:200, 375, 425
a, b, c:375, 200, 425
a, b, c:500, 0, 500
耗时:0.510947s

发现执行时间明显缩短了!

1. 算法的概念

算法是计算机处理信息的本质,因为计算机程序本质上是⼀个算法来告诉计 算机确切的步骤来执⾏⼀个指定的任务。⼀般地,当算法在处理信息时,会 从输⼊设备或数据的存储地址读取数据,把结果写⼊输出设备或某个存储地 址供以后再调⽤。 算法是独⽴存在的⼀种解决问题的⽅法和思想。 对于算法⽽⾔,实现的语⾔并不重要,重要的是思想。 算法可以有不同的语⾔描述实现版本(如C描述、C++描述、Python描述 等),我们现在是在⽤ Python 语⾔进⾏描述实现。

2. 算法的五⼤特性

  1. 输⼊: 算法具有 0 个或多个输⼊
  2. 输出: 算法⾄少有 1 个或多个输出
  3. 有穷性: 算法在有限的步骤之后会⾃动结束⽽不会⽆限循环,并且每⼀个步骤可以在可接受的时间内完成
  4. 确定性:算法中的每⼀步都有确定的含义,不会出现⼆义性
  5. 可⾏性:算法的每⼀步都是可⾏的,也就是说每⼀步都能够执⾏有限的次数完成

3. 算法效率衡量

1. 执⾏时间反应算法效率

对于同⼀问题,我们给出了两种解决算法,在两种算法的实现中,我们对程 序执⾏的时间进⾏了测算,发现两段程序执⾏的时间相差悬殊,由此我们可以得出结论:实现算法程序的执⾏时间可以反映出算法的效率,即算法的优劣。

2. 单靠时间值绝对可信吗?

假设我们将第⼆次尝试的算法程序运⾏在⼀台配置古⽼性能低下的计算机 中,情况会如何?很可能运⾏的时间并不会⽐在我们的电脑中运⾏算法⼀的 214.583347秒快多少。
单纯依靠运⾏的时间来⽐较算法的优劣并不⼀定是客观准确的!
程序的运⾏离不开计算机环境(包括硬件和操作系统),这些客观原因会影 响程序运⾏的速度并反应在程序的执⾏时间上。那么如何才能客观的评判⼀ 个算法的优劣呢?

3. 时间复杂度与 “⼤O记法”

我们假定计算机执⾏算法每⼀个基本操作的时间是固定的⼀个时间单位,那 么有多少个基本操作就代表会花费多少时间单位。显然对于不同的机器环境 ⽽⾔,确切的单位时间是不同的,但是对于算法进⾏多少个基本操作(即花 费多少时间单位)在规模数量级上却是相同的,由此可以忽略机器环境的影 响⽽客观的反应算法的时间效率。 对于算法的时间效率,我们可以⽤ “⼤O记法” 来表示。

“⼤O记法”:对于单调的整数函数 f,如果存在⼀个整数函数 g 和实常数 c>0, 使得对于充分⼤的 n 总有 f(n)<=c*g(n) ,就说函数 g 是 f 的⼀个渐近函数(忽略常数),记为 f(n)=O(g(n))。也就是说,在趋向⽆穷的极限意义下,函数 f 的增⻓速度受到函数 g 的约束,亦即函数 f 与函数 g 的特征相似。

时间复杂度:假设存在函数 g,使得算法 A 处理规模为 n 的问题示例所⽤时间为 T(n)=O(g(n)),则称 O(g(n)) 为算法 A 的渐近时间复杂度,简称时间复杂度,记为T(n)

4. 如何理解“⼤O记法”

对于算法进⾏特别具体的细致分析虽然很好,但在实践中的实际价值有限。 对于算法的时间性质和空间性质,最重要的是其数量级和趋势,这些是分析算法效率的主要部分。⽽计量算法基本操作数量的规模函数中那些常量因⼦可以忽略不计。例如,可以认为 3n2 和 100n2 属于同⼀个量级,如果两个算法处理同样规模实例的代价分别为这两个函数,就认为它们的效率 “差不多”, 都为 n2 级。

5. 最坏时间复杂度

分析算法时,存在⼏种可能的考虑:

  • 算法完成⼯作最少需要多少基本操作,即最优时间复杂度
  • 算法完成⼯作最多需要多少基本操作,即最坏时间复杂度
  • 算法完成⼯作平均需要多少基本操作,即平均时间复杂度

分析:

  • 对于最优时间复杂度,其价值不⼤,因为它没有提供什么有⽤信息,其反映的只是最乐观最理想的情况,没有参考价值;
  • 对于最坏时间复杂度,提供了⼀种保证,表明算法在此种程度的基本操作中 ⼀定能完成⼯作;
  • 对于平均时间复杂度,是对算法的⼀个全⾯评价,因此它完整全⾯的反映了这个算法的性质。但另⼀⽅⾯,这种衡量并没有保证,不是每个计算都能在这个基本操作内完成。⽽且,对于平均情况的计算,也会因为应⽤算法的实例分布可能并不均匀⽽难以计算。

因此,我们主要关注算法的最坏情况,亦即最坏时间复杂度

6. 时间复杂度的⼏条基本计算规则
  1. 基本操作,即只有常数项,认为其时间复杂度为 O(1)
  2. 顺序结构,时间复杂度按加法进⾏计算
  3. 循环结构,时间复杂度按乘法进⾏计算
  4. 分⽀结构,时间复杂度取最⼤值
  5. 判断⼀个算法的效率时,往往只需要关注操作数量的最⾼次项,其它次要项和常数项可以忽略
  6. 在没有特殊说明时,我们所分析的算法的时间复杂度都是指最坏时间复杂度
7. 空间复杂度

类似于时间复杂度的讨论,⼀个算法的空间复杂度S(n)定义为该算法所耗费 的存储空间,它也是问题规模n的函数。
渐近空间复杂度也常常简称为空间复杂度。
空间复杂度(SpaceComplexity) 是对⼀个算法在运⾏过程中临时占⽤存储空间⼤⼩的量度。
算法的时间复杂度和空间复杂度合称为算法的复杂度。

4. 算法分析

第⼀次尝试的算法核⼼部分

for a in range(0, 1001):
	for b in range(0, 1001):
		for c in range(0, 1001):
			if a**2 + b**2 == c**2 and a+b+c == 1000:
				print("a, b, c: %d, %d, %d" % (a, b, c))

时间复杂度:T(n) = O(n*n*n) = O(n3)

第⼆次尝试的算法核⼼部分

for a in range(0, 1001):
	for b in range(0, 1001 - a):
		c = 1000 - a - b if a**2 + b**2 == c**2:
			print("a, b, c: %d, %d, %d" % (a, b, c))

时间复杂度: T(n) = O(n*n*(1+1)) = O(n*n) = O(n2)

由此可⻅,我们尝试的第⼆种算法要⽐第⼀种算法的时间复杂度好多的。

5. 常⻅时间复杂度

执⾏次数函数举例 ⾮正式术语
12 O(1) 常数阶
2n+3 O(n) 线性阶
3n2+2n+1 O(n2) 平⽅阶
5log2n+20 O(logn) 对数阶
2n+3nlog2n+19 O(nlogn) nlogn阶
6n3+2n2+3n+4 O(n3) ⽴⽅阶
2n O(2n) 指数阶

注意,经常将 log2n(以 2 为底的对数)简写成 logn

常⻅时间复杂度之间的关系为:

数据结构与算法1:引入概念
所消耗的时间从⼩到⼤:

O(1) < O(logn) < O(n) < O(nlogn) < O(n2) < O(n3) < O(2n) < O(n!) < O(nn)

6. Python内置类型性能分析

1. timeit 模块

timeit 模块可以⽤来测试⼀⼩段 Python 代码的执⾏速度

class timeit.Timer(stmt=‘pass’, setup=‘pass’, timer=<timer function>)

参数说明:

  • Timer 是测量⼩段代码执⾏速度的类
  • stmt 参数是要测试的代码语句(statment)
  • setup 参数是运⾏代码时需要的设置
  • timer 参数是⼀个定时器函数,与平台有关

timeit.Timer.timeit(number=1000000)

  • Timer 类中测试语句执⾏速度的对象⽅法。number 参数是测试代码时的测试次数,默认为 1000000 次。⽅法返回执⾏代码的平均耗时,⼀个 float 类型的秒数
2. list 的操作测试
1. 添加元素的四种方式效率比较
from timeit import Timer

def t1():
    l = []
    for i in range(1000):
        l = l + [i]

def t2():
    l = []
    for i in range(1000):
        l.append(i)

def t3():
    l = [i for i in range(1000)]

def t4():
    l = list(range(1000))

timer1 = Timer("t1()", "from __main__ import t1")
print("concat", timer1.timeit(number=1000), "s")
timer2 = Timer("t2()", "from __main__ import t2")
print("append", timer2.timeit(number=1000), "s")
timer3 = Timer("t3()", "from __main__ import t3")
print("comprehension", timer3.timeit(number=1000), "s")
timer4 = Timer("t4()", "from __main__ import t4")
print("list_range", timer4.timeit(number=1000), "s")

'''
concat 1.0436126479980885 s
append 0.08462878499994986 s
comprehension 0.03660322499490576 s
list_range 0.014424725006392691 s
'''
2. 删除元素的两种方式效率比较
  • 从结果可以看出,pop 最后⼀个元素的效率远远⾼于 pop 第⼀个元素
x = list(range(2000000))
pop_zero = Timer("x.pop(0)", "from __main__ import x")
print("pop_zero", pop_zero.timeit(number=1000), "s")
y = list(range(2000000))
pop_end = Timer("y.pop()", "from __main__ import y")
print("pop_end", pop_end.timeit(number=1000), "s")

'''
pop_zero 0.9256400320009561 s
pop_end 9.138700261246413e-05 s
'''
3. list 内置操作的时间复杂度

数据结构与算法1:引入概念

4. dict 内置操作的时间复杂度

数据结构与算法1:引入概念

7. 数据结构

我们如何⽤Python中的类型来保存⼀个班的学⽣信息? 如果想要快速的通过学⽣姓名获取其信息呢?

实际上当我们在思考这个问题的时候,我们已经⽤到了数据结构。列表和字 典都可以存储⼀个班的学⽣信息,但是想要在列表中获取⼀名同学的信息时,就要遍历这个列表,其时间复杂度为 O(n),⽽使⽤字典存储时,可将学⽣姓名作为字典的键,学⽣信息作为值,进⽽查询时不需要遍历便可快速获取到学⽣信息,其时间复杂度为 O(1)。

我们为了解决问题,需要将数据保存下来,然后根据数据的存储⽅式来设计 算法实现进⾏处理,那么数据的存储⽅式不同就会导致需要不同的算法进⾏处理。我们希望算法解决问题的效率越快越好,于是我们就需要考虑数据究竟如何保存的问题,这就是数据结构。

在上⾯的问题中我们可以选择 Python 中的列表或字典来存储学⽣信息。列表和字典就是 Python 内建帮我们封装好的两种数据结构。

1. 概念

数据是⼀个抽象的概念,将其进⾏分类后得到程序设计语⾔中的基本类型。 如:int,float,char 等。数据元素之间不是独⽴的,存在特定的关系,这些关系便是结构。

数据结构指数据对象中数据元素之间的关系。 Python 给我们提供了很多现成的数据结构类型,这些系统⾃⼰定义好的,不需要我们⾃⼰去定义的数据结构叫做 Python 的内置数据结构,⽐如列表、元 组、字典。⽽有些数据组织⽅式,Python 系统⾥⾯没有直接定义,需要我们⾃⼰去定义实现这些数据的组织⽅式,这些数据组织⽅式称之为 Python 的扩展数据结构,⽐如栈,队列等。

2. 算法与数据结构的区别

数据结构只是静态的描述了数据元素之间的关系。
⾼效的程序需要在数据结构的基础上设计和选择算法。

程序 = 数据结构 + 算法
总结:算法是为了解决实际问题⽽设计的,数据结构是算法需要处理的问题载体

3. 抽象数据类型(Abstract Data Type)

抽象数据类型(ADT) 的含义是指⼀个数学模型以及定义在此数学模型上的⼀ 组操作。即把数据类型和数据类型上的运算捆在⼀起,进⾏封装。引⼊抽象 数据类型的⽬的是把数据类型的表示和数据类型上运算的实现与这些数据类 型和运算在程序中的引⽤隔开,使它们相互独⽴。

最常⽤的数据运算有五种:文章来源地址https://www.toymoban.com/news/detail-437270.html

  • 插⼊
  • 删除
  • 修改
  • 查找
  • 排序

到了这里,关于数据结构与算法1:引入概念的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据结构 | 入门】线性表与链表 (问题引入&实现&算法优化)

    🤵‍♂️ 个人主页: @计算机魔术师 👨‍💻 作者简介:CSDN内容合伙人,全栈领域优质创作者。 本文是浙大数据结构学习笔记专栏 这里我们引入一个问题,最常见的多项式,我们如何使用编程将多项式表示出来呢? 我们可以使用数组来表示,但是会随着一个问题,如下图底

    2024年01月21日
    浏览(26)
  • 【全面突击数据结构与算法001】绪论篇,数据结构的基本概念

    👑 作 者 主 页 :👉CSDN丨博客园 🏆 学 习 交 流 :👉在下周周ovoの社区 💎全 面 突 击 数 据 结 构 与 算 法 系 列 专 栏: 👉 数据结构与算法专栏 PS:本篇文章主要综合了【王道数据结构与算法】与我的个人笔记与理解,如果文章有任何错误欢迎各位大佬的指出 快期末考

    2024年02月07日
    浏览(23)
  • C++11 数据结构0 什么是 “数据结构“?数据,数据对象,数据元素,数据项 概念。算法的基本概念 和 算法的度量,大O表示法,空间换时间的代码

    是能输入计算机且能被计算机处理的各种符号的集合。 数值型的数据:整数和实数。 非数值型的数据:文字、图像、图形、声音等。         性质相同的 \\\"数据元素\\\" 的集合         例如一个 int arr[10],  Teacher tea[3]; 数据元素:          tea[0],tea[1],arr[2],这些都是 数据项:

    2024年04月15日
    浏览(19)
  • 数据结构与算法--图(概念+练习题+解析)

    有向图 在有向图中有以下几点结论: 1.所有顶点的度数之和等于边数的二倍。 2.所有顶点的入度之和等于出度之和。 3.n个顶点的有向完全图有n(n-1)条边。 4.n个顶点的强连通图至少有n条边。 无向图 在无向图中有以下几点结论: 1.所有顶点的度数之和等于边数的二倍。 2.n个顶

    2024年02月04日
    浏览(14)
  • 1绪论_1.1数据结构的基本概念+1.2算法和算法评价

    数据 数据是信息的载体,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。 数据 由 数据对象 和 数据关系 组成(应试)⚡ 数据元素 数据元素是数据的 基本单位 ,通常作为一个整体进行考虑

    2024年02月07日
    浏览(14)
  • 【C语言】数据结构的基本概念与评价算法的指标

    1.1 基本概念和术语 1.1.1 数据 数据是信息的载体,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料 1.1.2 数据元素 数据元素是数据的基本单位,通常作为一个整体进行考虑和处理,一个数据元素

    2024年02月09日
    浏览(14)
  • 算法与数据结构(二)--【1】表的概念及其四种实现方式

    目录 一.表是什么 二.用动态数组实现表 三.用链表(指针)实现表 四.用间接寻址方法实现表 【1】定义:表,又称为线性表。 线性表L是n个相同类型数据元素a(1),a(2),...,a(n)组成的有限序列。 重点:序列!简单说就是一长串的数据,与树和图区分开! 【2】相关概念: 表长:线性

    2024年02月16日
    浏览(14)
  • 【数据结构与算法】图的基本概念 | 邻接矩阵和邻接表 | 广度优先遍历和深度优先遍历

    🌠 作者:@ 阿亮joy. 🎆 专栏:《数据结构与算法要啸着学》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 图是由顶点集合及顶点间的关系组成的一种数据结构:G = (V, E) ,其中: 顶点集合V = {x|x属于某

    2024年02月04日
    浏览(28)
  • 【初阶数据结构】——堆的引入

    目录 前言 一、二叉树的顺序结构及实现  1.1二叉树的顺序结构 1.2堆的结构 二、堆的实现 2.1堆向上调整算法(堆的插入) 2.2堆向下调整算法(堆的删除) 2.3建堆的时间复杂度 2.4堆的创建 2.5堆的初始化和空间的销毁 2.6堆的插入 向上调整函数 交换函数 2.7堆的删除 向下调整

    2024年02月07日
    浏览(15)
  • 【数据结构】一、数据结构的基本概念

    数据是 信息的载体 ,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序 识别 和 处理 的符号的集合。 数据是计算机程序加工的原料。 数据元素 是数据的基本单位。通常作为一个整体进行考虑和处理,用一个 数据元素 描述一个个体。一个数据元素可

    2024年03月10日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包