MIT（计算机科学）学习心得

1.算法和程序之间的区别是什么？ What is the difference between an Algorithm and a Program?
：算法是一个概念，程序是算法的具体实现 An algorithm is a conceptual idea, a program is a concrete instantiation of an algorithm.
2.计算思维模式意味着一切都可以看做是一个涉及到数字和公式的数学问题。 True or False? A computational mode of thinking means that everything can be viewed as a math problem involving numbers and formulas.
：Ture;
3.计算机科学是研究如何建立高效的程序运行机器。 True or False? Computer Science is the study of how to build efficient machines that run programs.
:False;
4.任何计算机都能做的两件事是 The two things every computer can do are:
：进行计算 Perform calculations
：存储结果 Remember the results
5.陈述性知识是事实的陈述。Declarative knowledge refers to statements of fact.
：Ture;
6.命令性知识是如何做的方法。Imperative knowledge refers to ‘how to’ methods.
:Ture;
7.不能把推算平方根的方法写成真正的计算机程序是因为计算机不能猜出 y 的初始值。The recipe for deducing square root cannot be made into a real computer program because computers cannot guess a starting value for y.
:Ture;
8.储存程序式计算机被设计为可以精确地执行一种特定计算，如计算平方根或者导弹弹道。True or False? A stored program computer is designed to compute precisely one computation, such as a square root, or the trajectory of a missile.
:False;
9.固定程序式计算机被设计为可以运行任何计算，通过解释它所读入的一系列程序指令。True or False? A fixed program computer is designed to run any computation, by interpreting a sequence of program instructions that are read into it.
:False;
10.程序计数器A program counter
:指向程序将执行的下一条命令points the computer to the next instruction to execute in the program.
11.我们讲的“计算机按照顺序地执行一些运算”是什么意思？What does it mean when we say that “the computer walks through the sequence executing some computation”?
:计算机大部分时候以线性顺序执行指令，除了有时它将跳转到序列的不同地方。The computer executes the instructions mostly in a linear sequence, except sometimes it jumps to a different place in the sequence.
12.为了计算所有可计算的事物，每个计算机必须能够处理16种最原始的操作。True or False? In order to compute everything that is computable, every computer must be able to handle the sixteen most primitive operations.
:False;
13.判定一个字串是否合法Determines whether a string is legal
:语法Syntax;
14.判定一个字串是否有意义Determines whether a string has meaning
: 静态语义Static semantics ;
15.赋予一个合法的语句意义Assigns a meaning to a legal sentence
:语义Semantics;

计算机科学（一门科学领域）：
计算机科学，研究计算机及其周围各种现象和规律的科学，亦即研究计算机系统结构、程序系统（即软件）、人工智能以及计算本身的性质和问题的学科。计算机科学是一门包含各种各样与计算和信息处理相关主题的系统学科，从抽象的算法分析、形式化语法等等，到更具体的主题如编程语言、程序设计、软件和硬件等。计算机科学分为理论计算机科学和实验计算机科学两个部分。后者常称为“计算机科学”而不冠以“实验”二字。前者有其他名称，如计算理论、计算机理论、计算机科学基础、计算机科学数学基础等。数学文献中一般指理论计算机科学。

迭代法：
迭代法也称辗转法，是一种不断用变量的旧值递推新值的过程，跟迭代法相对应的是直接法，即一次性解决问题。迭代法又分为精确迭代和近似迭代。“二分法”和“牛顿迭代法”属于近似迭代法。迭代算法是用计算机解决问题的一种基本方法。它利用计算机运算速度快、适合做重复性操作的特点，让计算机对一组指令（或一定步骤）进行重复执行，在每次执行这组指令（或这些步骤）时，都从变量的原值推出它的一个新值。

黑盒测试：
黑盒测试也称功能测试，它是通过测试来检测每个功能是否都能正常使用。在测试中，把程序看作一个不能打开的黑盒子，在完全不考虑程序内部结构和内部特性的情况下，在程序接口进行测试，它只检查程序功能是否按照需求规格说明书的规定正常使用，程序是否能适当地接收输入数据而产生正确的输出信息。黑盒测试着眼于程序外部结构，不考虑内部逻辑结构，主要针对软件界面和软件功能进行测试。黑盒测试是以用户的角度，从输入数据与输出数据的对应关系出发进行测试的。很明显，如果外部特性本身设计有问题或规格说明的规定有误，用黑盒测试方法是发现不了的。

随机数：
随机数是专门的随机试验的结果。

编程语言：
编程语言（programming language），是用来定义计算机程序的形式语言。它是一种被标准化的交流技巧，用来向计算机发出指令。一种计算机语言让程序员能够准确地定义计算机所需要使用的数据，并精确地定义在不同情况下所应当采取的行动。最早的编程语言是在电脑发明之后产生的，当时是用来控制提花织布机及自动演奏钢琴的动作。在电脑领域已发明了上千不同的编程语言，而且每年仍有新的编程语言诞生。很多编程语言需要用指令方式说明计算的程序，而有些编程语言则属于声明式编程，说明需要的结果，而不说明如何计算。编程语言的描述一般可以分为语法及语义。语法是说明编程语言中，哪些符号或文字的组合方式是正确的，语义则是对于编程的解释。有些语言是用规格文件定义，例如C语言的规格文件也是ISO标准中一部份，2011年后的版本为ISO/IEC 9899:2011，而其他语言（像Perl）有一份主要的编程语言实现文件，视为是参考实现。编程语言俗称“计算机语言”，种类非常的多，总的来说可以分成机器语言、汇编语言、高级语言三大类。电脑每做的一次动作，一个步骤，都是按照已经用计算机语言编好的程序来执行的，程序是计算机要执行的指令的集合，而程序全部都是用我们所掌握的语言来编写的。所以人们要控制计算机一定要通过计算机语言向计算机发出命令。目前通用的编程语言有两种形式：汇编语言和高级语言。

数据结构（计算机存储、伪代码：
伪码（Pseudocode）是一种算法描述语言。使用伪码的目的是使被描述的算法可以容易地以任何一种编程语言（Pascal，C，Java等）实现。因此，伪代码必须结构清晰、代码简单、可读性好，并且类似自然语言。介于自然语言与编程语言之间。以编程语言的书写形式指明算法职能。使用伪代码，不用拘泥于具体实现。相比程序语言（例如Java, C++,C, Dephi 等等）它更类似自然语言。它是半角式化、不标准的语言。可以将整个算法运行过程的结构用接近自然语言的形式（可以使用任何一种你熟悉的文字，关键是把程序的意思表达出来）描述出来组织数据方式）

计算思维：
计算思维是运用计算机科学的基础概念进行问题求解、系统设计、以及人类行为理解等涵盖计算机科学之广度的一系列思维活动。

机器学习：
机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎

软件工程（学科）：
软件工程是一门研究用工程化方法构建和维护有效的、实用的和高质量的软件的学科。它涉及程序设计语言、数据库、软件开发工具、系统平台、标准、设计模式等方面。在现代社会中，软件应用于多个方面。典型的软件有电子邮件、嵌入式系统、人机界面、办公套件、操作系统、编译器、数据库、游戏等。同时，各个行业几乎都有计算机软件的应用，如工业、农业、银行、航空、政府部门等。这些应用促进了经济和社会的发展，也提高了工作效率和生活效率。

索引（汉语词语）：
索引，指将文献中具有检索意义的事项（可以是人名、地名、词语、概念、或其他事项）按照一定方式有序编排起来，以供检索的工具书。

调试：
调试是保证所提供的设备能够正常运行的必须程序，所有费用由设备提供商负担。

序列（被排成一列的对象）：
数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

字节：
字节（Byte /bait/ n. [C]）是计算机信息技术用于计量存储容量的一种计量单位，也表示一些计算机编程语言中的数据类型和语言字符。

指令（算术运算）：
指示是命令旧时公文的一种，是上级对下级呈请的批示。另有解释，告诉计算机从事某一特殊运算的代码。如：数据传送指令、算术运算指令、位运算指令、程序流程控制指令、串操作指令、处理器控制指令。

参数：
参数，也叫参变量，是一个变量。我们在研究当前问题的时候，关心某几个变量的变化以及它们之间的相互关系，其中有一个或一些叫自变量，另一个或另一些叫因变量。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化，引入的变量本来并不是当前问题必须研究的变量，我们把这样的变量叫做参变量或参数。英文名：Parameter。

防御性编程：
防御性编程，是防御式设计的一种具体体现，它是为了保证，对程序的不可预见的使用，不会造成程序功能上的损坏。

线性组合：
线性组合是一个线性代数中的概念，代表一些抽象的向量各自乘上一个标量后再相加。

计算机程序：
计算机程序或者软件程序（通常简称程序）是指一组指示计算机每一步动作的指令，通常用某种程序设计语言编写，运行于某种目标体系结构上。

停机问题：
停机问题是目前逻辑学的焦点，和第三次数学危机的解决方案。其本质问题是: 给定一个图灵机 T，和一个任意语言集合 S, 是否 T 会最终停机于每一个s∈S。其意义相同于可确定语言。显然任意有限 S 是可判定性的，可列的(countable) S 也是可停机的。
换一换

密码学：
密码学是研究编制密码和破译密码的技术科学。研究密码变化的客观规律，应用于编制密码以保守通信秘密的，称为编码学；应用于破译密码以获取通信情报的，称为破译学，总称密码学。电报最早是由美国的摩尔斯在1844年发明的，故也被叫做摩尔斯电码。它由两种基本信号和不同的间隔时间组成：短促的点信号" ．"，读" 的 “（Di）；保持一定时间的长信号”—"，读"答 "（Da）。间隔时间：滴，1t；答,3t；滴答间,1t；字母间,3t；字间,5t。

存储程序：
“存储程序”原理，是将根据特定问题编写的程序存放在计算机存储器中，然后按存储器中的存储程序的首地址执行程序的第一条指令，以后就按照该程序的规定顺序执行其他指令，直至程序结束执行。

计数器：
计数是一种最简单基本的运算，计数器就是实现这种运算的逻辑电路，计数器在数字系统中主要是对脉冲的个数进行计数，以实现测量、计数和控制的功能，同时兼有分频功能，计数器是由基本的计数单元和一些控制门所组成，计数单元则由一系列具有存储信息功能的各类触发器构成，这些触发器有RS触发器、T触发器、D触发器及JK触发器等。计数器在数字系统中应用广泛，如在电子计算机的控制器中对指令地址进行计数，以便顺序取出下一条指令，在运算器中作乘法、除法运算时记下加法、减法次数，又如在数字仪器中对脉冲的计数等等。计数器可以用来显示产品的工作状态，一般来说主要是用来表示产品已经完成了多少份的折页配页工作。它主要的指标在于计数器的位数，常见的有3位和4位的。很显然，3位数的计数器最大可以显示到999，4位数的最大可以显示到9999。

字符：
在计算机和电信技术中，一个字符是一个单位的字形、类字形单位或符号的基本信息。

平方根（数学符号）：
平方根，又叫二次方根，表示为〔±√￣〕，其中属于非负数的平方根称之为算术平方根（arithmetic square root）。一个正数有两个实平方根，它们互为相反数；0只有一个平方根，就是0本身；负数有两个共轭的纯虚平方根。一般地，“√￣”仅用来表示算术平方根，即非负数的非负平方根。如：数学语言为：√￣16=4。语言描述为：根号下16=4（也可叫根号16=4）。

编码：
在计算机硬件中，编码（coding）是指用代码来表示各组数据资料，使其成为可利用计算机进行处理和分析的信息。代码是用来表示事物的记号，它可以用数字、字母、特殊的符号或它们之间的组合来表示
将数据转换为代码或编码字符，并能译为原数据形式。是计算机书写指令的过程，程序设计中的一部分。在地图自动制图中，按一定规则用数字与字母表示地图内容的过程，通过编码，使计算机能识别地图的各地理要素。
n位二进制数可以组合成2的n次方个不同的信息，给每个信息规定一个具体码组，这种过程也叫编码。
数字系统中常用的编码有两类，一类是二进制编码，另一类是十进制编码。
编码问题一直都伴随着程序猿从不间断，刚开始学编程的时候好多次遇到编码问题，解决了文件读取的编码问题，又遇到了网络编码问题，解决了网络编码问题又遇到了数据库编码问题。总结一下无非就是编码原理没搞清楚，希望本文能从原理上让菜鸟们理解编码，遇到问题可以从原理上搞定编码。

重点讲编码！！！！
　　一.编码

人类先有了自己的语言，交流了若干个世纪，然后出现了计算机。可惜计算机只认0和1，人类只能认文字，双方都不能妥协，那就必须要有一个从文字到0、1的映射了。从文字到0、1的映射称为编码，反过来从0、1到文字叫解码。

具体什么是编码？先来咬文嚼字一下吧。编就是将某样东西按照一定的规则放到一起，码在这里是数字的意思。编码就是将某东西编成数字。比如邮政编码，就是将不同范围内的邮局编成不同的数字。计算机里只有0和1，编码就是将文本字符编成一系列的0和1，看起来好像是废话啊，但这确实是编码的本质。

后来经过编码，计算机屏幕上终于可以显示“Hello World”了。学计算机之前谁都不知道有这么一个过程，因为一切看上去都理所当然。这种根深蒂固的认识让我们对编码理解起来犯了难。

首先屏幕的显示跟计算机存储是两码事，屏幕对应人们的视觉认知，它是无形的，你找不出来在哪里刻了这么两个单词，而计算机存储是客观存在的。计算机里只有0和1，怎么来表示“Hello World”呢（假如我们在美国），那就需要将字母数字及标点符号编一个号。一个字节可以表示256个数字，表示字母数字标点足够了，所以用一个字节就可以对应一个字符了。这样一来计算机在显示文字的时候，先将0、1解码成对应的文字，然后在屏幕上渲染出来就可以了。我们将“Hello World”叫做字符，计算机实际存储的是字符对应的编号，这些编号就叫字节流。

上边这种编码就是ASCII码，如果计算机只在美国用或者只显示英语，那编码就是透明的，谁都不需要去关心编码，一切都觉得理所当然。可是计算机应用到了像中国这样的国家，这些国家的语言哪里只是几个字母啊，有成千上万种不同的字符。很显然ASCII码就不能满足需求了，怎么办呢，每个国家都研制自己的编码呗，很显然这样做并不长久，每个国家都有自己的编码实在有点乱，连两个国家的语言都不能放在一起。所以可以将世界当成一个整体，把所有的文字统一编号，这时候就出现了unicode编码。用一个字节来表示一个字符显然是不够的，unicode编码用了两个字节来表示一个字符。其实，编码的发展过程并没有这么顺利，中间还是出现了很多其他的编码，以后的文章可以详细说一下几种常用的编码。那问题岂不是解决了，大家都用unicode不就完事了吗，哪有这么简单呢，unicode出现之前计算机领域已经有很多成型的操作系统软件甚至标准，不可能都统一改成unicode编码。所以到现在还是会遇到编码问题，unicode只是给我们提供了一种统一解释所有文字的编码方案。要搞清楚，这里讨论的编码都是针对文本字符的。

二.乱码

编码之所以受到关注，乱码几乎起到了决定性的作用，如果没有乱码，一切都让大家觉得顺理成章，那谁还会关注编码呢。

出现乱码的原因就是文本字符编码过程与字节流解码过程使用了不同的编码格式，这个往往归咎于解码格式选择错误，也就是说在解码的过程中出现了问题。如果我的字符是用utf-8编码，你用GBK解码那肯定出问题。因为文字按照utf-8的编码规则编成的0、1，按照GBK的规则解码回来的文字并不是原来的文字，这时候就会出现乱码了。这种问题会出现在文件读写、网络编码传输、数据库存取上。只要牵涉到字符都有可能出现乱码，因为只要有字符就会有解码过程。

还有一种情况就是文件压根不是文本文件，也就是说根本就没有经过编码这个过程，那你去解码当然乱码了。比如64，你如果看做文本字符就是6和4两个字符，可以对应编码格式进行编码。如果看做是数字64，那对应的存储结构是01000000，就没有编码过程，也就不需要去解码。

要搞清楚的一点就是同样的文本字符，经过不同的编码，在存储结构上是不一样的，但是代表的字符是一样的，不同编码真正的区别在于存储结构。反过来，相同的存储结构，经过不同的解码，对应的文本字符并不一样，但是在内存上结构上并没有改变。如果碰到乱码，不要慌张，因为原始存储结构一动没动，只不过用错了解码方式。就像一千个读者有一千个哈姆雷特一样，真实的哈姆雷特就在那里。

乱码是显示在屏幕上才被认为是乱码，也就是说乱码取决于人的感官，乱码只有人才知道﹐计算机不认为这是乱码。

三.文件编码

不管是文本还是图片或视频，在计算机存储上都是一视同仁，全都是字节流。但是从方便人们阅读的角度上还是分为文本文件和二进制文件。文本文件的可视形式就是文本字符，在存储和显示时有文本字符编解码的过程，可以直接用文本编辑器阅读。除文本文件以外就是二进制文件，不同类型的二进制文件都有相应的结构标准，例如java的class文件，前四个字节代表文件类型，后边两个字节代表大版本号，再后边两个字节代表小版本号。具体哪些字节代表什么意思，值是float类型还是int类型，都有一定的标准，所以需要特定的软件按照标准去读取解析。

在不同的编程语言中，往往提供不同的类对文本文件和二进制文件进行读写。最常用的就是文本文件的读写例如C#中有StreamReader和StreamWriter，Java中有BufferedReader和 BufferedWriter。还有二进制文件的读写例如C#中有BinaryReader和BinaryWriter，Java中有 DataInputStream和DataOutputStream。当然读写二进制文件的类也可以读写文本文件，因为文本文件和二进制文件的存储在本质上是没有区别的，都是二进制。只不过专门读写文本文件的类封装的更好，读写文本文件更方便。

MIT（计算机科学） 学习心得

猜你喜欢

MIT（计算机科学）学习心得