TYPE SAR=ARRAY[1..m] OF INTEGER; PTY=ARRAY[1..m] OF CHAR;
PROCEDURE next2(P:PTY;VAR NEXTVAL:SAR); {在模式P中求nextval数组的值} 1 BEGIN
2 J:=1;NEXTVAL[1]:=0;K:=0 3 REPEAT
4 IF (K=0) OR (P[J]=P[K]) 5 THEN [ J:=J+1;K:=K+1; 6 IF P[J]=P[K]
7 THEN NEXTVAL[J]:=NEXTVAL[K] 8 ELSE NEXTVAL[J]:=K ] 9 ELSE K:=NEXTVAL[K] 10 UNTIL J=m 11 END;
算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。两处比较语句相同。请分析说明此两处比较语句的含义是什么?分析此算法在最坏情况下的时间复杂度是多少?【北京邮电大学 1993 二、2(6分)】 20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下:
next[j]=******* 请问:
(1)当j=1时,为什么要取next[1]=0? (2)为什么要取max{K},K最大是多少?
(3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学 1994 二(8分)】 21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么?
【东南大学 1993 一、3 (9分) 1997 一、2 (8分) 2001 一、6 (6分)】
22. 在模试匹配KMP算法中所用失败函数f的定义中,为何要求p1p2??pf(j)为p1p2??pj两头匹配的真子串?且为最大真子串? 【东南大学 1996 一、3(7分)】
23.如果两个串含有相等的字符,能否说它们相等?【西安电子科技大学 2000软件 一、3 (5分)】 24.设S1,S2为串,请给出使S1//S2=S2//S1成立的所有可能的条件(//为连接符)。
【长沙铁道学院 1997 三、5 (3分)】【国防科技大学 1999 一 】
25.已知:s ='(xyz)+*',t ='(x+z)*y'。试利用联结、求子串和置换等基本运算,将 s 转化为 t 。
【北方交通大学 1996 一、3(5分)】【山东科技大学 2002 一、6 (5分)】 第五部分、算法设计
1.设s、t为两个字符串,分别放在两个一维数组中,m、n分别为其长度,判断t是否为s的子串。如果是,输出子串所在位置(第一个字符),否则输出0。(注:用程序实现)【南京航空航天大学 1997 九(10分)】
2.输入一个字符串,内有数字和非数字字符,如:ak123x456 17960?302gef4563,将其中连续的数字作为一个整体,依次存放到一数组a中,例如123放入a[0],456放入a[1],? ? 。编程统计其共有多少个整数,并输出这些数。【上海大学 1998 一 (13分)】
3. 以顺序存储结构表示串,设计算法。求串S中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。【东南大学 2000 五 (15分)】
类似本题的另外叙述有:
(1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。试设计一算法,输入字符串S,以“!”作为结束标志。如果串S中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。
例如:若S=“abc123abc123!”,则输出“无等值子串”;若S=“abceebccadddddaaadd!”,则输出“ddddd”。
【华中科技大学 2001】
4.假设串的存储结构如下所示,编写算法实现串的置换操作。【清华大学 1995 五(15分)】
TYPE strtp =RECORD
ch: ARRAY[1..maxlen] OF char; curlen:0..maxlen END;
5.函数void insert(char*s,char*t,int pos)将字符串t插入到字符串s中,插入位置为pos。请用c语言实现该函数。假设分配给字符串s的空间足够让字符串t插入。(说明:不得使用任何库函数)
【北京航空航天大学 2001 六 (10分)】
6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4。
(1)简述算法的主要思想;(3分)
(2)用PASCAL语言分别对算法中用到的类型和变量作出说明;(3分) (3)用类PASCAL语言或自然语言写算法的非递归过程; (8分) (4)分析该算法的最大检索长度;(3分) (5)必要处加上中文注释。(3分) 【山东工业大学 1995 八 (20分)】
7.设计一PASCAL 或C语言的函数 atoi(x).其中X 为字符串,由0--9十个数字符和表示正负数的‘-’组成,返回值为整型数值 。【浙江大学 1994 二 (7分)】
8.已知字符串S1中存放一段英文,写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2, 其多余的字符送S3。 【首都经贸大学 1998 三、8(15分)】 9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法.
CONST maxlen=串被确认的最大长度 TYPE strtp=RECORD
ch:ARRAY[1..maxlen] OF char; curlen:0..maxlen END;
(以一维数组存放串值,并设指示器curlen指示当前串长)【北京轻工业大学 1998 一 (12分)】 10.编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为A-Z这26个字母和0-9这10个数字)。【西北大学 2000 四 (10分)】
11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。 【西南交通大学 2000 三、2】 12.已知三个字符串分别为s=’ab?abcaabcbca?a’,s’=’caab’, s’’=’bcb’。利用所学字符串基本运算的函数得到结果串为:s’’’=’caabcbca?aca?a’,要求写出得到上结果串S’’’所用的函数及执行算法。【东北大学 1998 一、1 (10分)】
13.S=“S1S2?Sn”是一个长为N的字符串,存放在一个数组中,编程序将S改造之后输出:
(1)将S的所有第偶数个字符按照其原来的下标从大到小的次序放在S的后半部分; (2)将S的所有第奇数个字符按照其原来的下标从小到大的次序放在S的前半部分; 例如:S=‘ABCDEFGHIJKL’
则改造后的S为‘ACEGIKLJHFDB’。【中科院计算所 1995】 14.编一程序,对输入的一表达式(字符串),输出其TOKEN表示。表达式由变量A,B,C,常数(数字)0,1,?,9,运算符+,*和括号“(”,“)”组成。首先定义符号的类码: 符号 变量 常量 * + ( ) 类码 0 1 2 3 4 5 其次定义符号的TOKEN表示: 其中NAMEL是变量名表(不允许有相同名),CONST是常量表(不允许有相同数)。 例如,假设有表达式(A+A*2)+2*B*3#,则将生成如下TOKENL:【吉林大学 1995 一 (20分)】
第四章 串
一、选择题 1.B 2.E 3.C 4.A 5.C 6.A 7.1D 7.2F 8.B注 9.D 10.B 注:子串的定义是:串中任意个连续的字符组成的子序列,并规定空串是任意串的子串,任意串是其自身的子串。若字符串长度为n(n>0),长为n的子串有1个,长为n-1的子串有2个,长为n-2的子串有3个,??,长为1的子串有n个。由于空串是任何串的子串,所以本题的答案为:8*(8+1)/2+1=37。故选B。但某些教科书上认为“空串是任意串的子串”无意义,所以认为选C。为避免考试中的二意性,编者认为第9题出得好。 二、判断题
1.√ 2.√ 3.√
三.填空题
1.(1) 由空格字符(ASCII值32)所组成的字符串 (2)空格个数 2.字符 3.任意个连续的字符组成的子序列 4.5 5.O(m+n) 6.01122312 7.01010421 8.(1)模式匹配 (2)模式串
9.(1)其数据元素都是字符(2)顺序存储(3)和链式存储(4)串的长度相等且两串中对应位置的字符也相等 10.两串的长度相等且两串中对应位置的字符也相等。 11.’xyxyxywwy’ 12.*s++=*t++ 或(*s++=*t++)!=‘\\0’ 13.(1)char s[ ] (2) j++ (3) i >= j
14.[题目分析]本题算法采用顺序存储结构求串s和串t的最大公共子串。串s用i指针(1<=i<=s.len)。t串用j指针(1<=j<=t.len)。算法思想是对每个i(1<=i<=s.len,即程序中第一个WHILE循环),来求从i开始的连续字符串与从j(1<=j<=t.len,即程序中第二个WHILE循环)开始的连续字符串的最大匹配。程序中第三个(即最内层)的WHILE循环,是当s中某字符(s[i])与t中某字符(t[j])相等时,求出局部公共子串。若该子串长度大于已求出的最长公共子串(初始为0),则最长公共子串的长度要修改。
程序(a):(1)(i+k<=s.len)AND(j+k<=t.len) AND(s[i+k]=t[j+k])
//如果在s和t的长度内,对应字符相等,则指针k 后移(加1)。 (2)con:=false //s和t对应字符不等时置标记退出
(3)j:=j+k //在t串中,从第j+k字符再与s[i]比较 (4)j:=j+1 //t串取下一字符
(5)i:=i+1 //s串指针i后移(加1)。
程序(b):(1) i+k<=s.len && j+k<=t.len && s[i+k]==t[j+k] //所有注释同上(a) (2) con=0 (3) j+=k (4) j++ (5) i++ 15.(1)0 (2)next[k] 16.(1)i:=i+1 (2)j:=j+1 (3)i:=i-j+2 (4)j:=1; (5)i-mt(或i:=i-j+1) (6)0 17.程序中递归调用
(1)ch1<>midch //当读入不是分隔符&和输入结束符$时,继续读入字符 (2)ch1=ch2 //读入分隔符&后,判ch1是否等于ch2,得出真假结论。 (3)answer:=true (4)answer:=false (5)read(ch) (6)ch=endch 18.(1)initstack(s) //栈s初始化为空栈。
(2) setnull (exp) //串exp初始化为空串。
(3) ch in opset //判取出字符是否是操作符。
(4) push (s,ch) //如ch是运算符,则入运算符栈s。 (5) sempty (s) //判栈s是否为空。
(6) succ := false //若读出ch是操作数且栈为空,则按出错处理。
(7) exp (8)ch //若ch是操作数且栈非空,则形成部分中缀表达式。 (9) exp (10) gettop(s) //取栈顶操作符。 (11) pop(s) //操作符取出后,退栈。
(12) sempty(s) //将pre的最后一个字符(操作数)加入到中缀式exp的最后。
四.应用题
1.串是零个至多个字符组成的有限序列。从数据结构角度讲,串属于线性结构。与线性表的特殊性在于串的元素是字符。
2.空格是一个字符,其ASCII码值是32。空格串是由空格组成的串,其长度等于空格的个数。空串是不含任何字符的串,即空串的长度是零。 3.最优的T(m,n)是O(n)。串S2是串S1的子串,且在S1中的位置是1。开始求出最大公共子串的长度恰是串S2的长度,一般情况下,T(m,n) =O(m*n)。
4.朴素的模式匹配(Brute-Force)时间复杂度是O(m*n),KMP算法有一定改进,时间复杂度达到O(m+n)。本题也可采用从后面匹配的方法,即从右向左扫描,比较6次成功。另一种匹配方式是从左往右扫描,但是先比较模式串的最后一个字符,若不等,则模式串后移;若相等,再比较模式串的第一个字符,若第一个字符也相等,则从模式串的第二个字符开始,向右比较,直至相等或失败。若失败,模式串后移,再重复以上过程。按这种方法,本题比较18次成功。
5.KMP算法主要优点是主串指针不回溯。当主串很大不能一次读入内存且经常发生部分匹配时,KMP算法的优点更为突出.
6.模式串的next函数定义如下:
next[j]=
根据此定义,可求解模式串t的next和nextval值如下: j 1 2 3 4 5 6 7 8 9 10 11 12 a b c a a b b a b c a b t串 next[j] 0 1 1 1 2 2 3 1 2 3 4 5 nextval[j] 0 1 1 0 2 1 3 0 1 1 0 5 7.解法同上题6,其next和nextval值分别为0112123422和0102010422。 8.解法同题6,t串的next和nextval函数值分别为0111232和0110132。 9.解法同题6,其next和nextval 值分别为011123121231和011013020131。
10.p1的next和nextval值分别为:0112234和0102102;p2的next和nextval值分别为:0121123和0021002。
11.next数组值为011234567 改进后的next数组信息值为010101017。 12.011122312。
13.next定义见题上面6和下面题20。串p的next函数值为:01212345634。 14(.1)S的next与nextval值分别为012123456789和002002002009,p的next与nextval值分别为012123和002003。
(2)利用BF算法的匹配过程: 利用KMP算法的匹配过程:
第一趟匹配: aabaabaabaac 第一趟匹配:aabaabaabaac
aabaac(i=6,j=6) aabaac(i=6,j=6) 第二趟匹配: aabaabaabaac 第二趟匹配:aabaabaabaac aa(i=3,j=2) (aa)baac 第三趟匹配: aabaabaabaac 第三趟匹配:aabaabaabaac
a(i=3,j=1) (成功) (aa)baac
第四趟匹配: aabaabaabaac
aabaac(i=9,j=6)
第五趟匹配: aabaabaabaac
aa(i=6,j=2)
第六趟匹配: aabaabaabaac
a(i=6,j=1)
第七趟匹配: aabaabaabaac
(成功) aabaac(i=13,j=7)
15.(1)p的nextval函数值为0110132。(p的next函数值为0111232)。
(2)利用KMP(改进的nextval)算法,每趟匹配过程如下: 第一趟匹配: abcaabbabcabaacbacba abcab(i=5,j=5)
第二趟匹配: abcaabbabcabaacbacba abc(i=7,j=3)
第三趟匹配: abcaabbabcabaacbacba a(i=7,j=1)
第四趟匹配: abcaabbabcabaac bacba (成功) abcabaa(i=15,j=8) 16.KMP算法的时间复杂性是O(m+n)。
p的next和nextval值分别为01112212321和01102201320。 17.(1)p的nextval函数值为01010。(next函数值为01123)
(2)利用所得nextval数值,手工模拟对s的匹配过程,与上面16题类似,为节省篇幅,故略去。 18.模式串T的next和nextval值分别为0121123和0021002。
19.第4行的p[J]=p[K]语句是测试模式串的第J个字符是否等于第K个字符,如是,则指针J和K均增加1,继续比较。第6行的p[J]=p[K]语句的意义是,当第J个字符在模式匹配中失配时,若第K个字符和第J个字符不等,则下个与主串匹配的字符是第K个字符;否则,若第K个字符和第J个字符相等,则下个与主串匹配的字符是第K个字符失配时的下一个(即NEXTVAL[K])。
2
该算法在最坏情况下的时间复杂度O(m)。 20.(1)当模式串中第一个字符与主串中某字符比较不等(失配)时,next[1]=0表示模式串中已没有字符可与主串中当前字符s[i]比较,主串当前指针应后移至下一字符,再和模式串中第一字符进行比较。 (2)当主串第i个字符与模式串中第j个字符失配时,若主串i不回溯,则假定模式串第k个字符与主串第i个字符比较,k值应满足条件1 (3)在上面两种情况外,发生失配时,主串指针i不回溯,在最坏情况下,模式串从第1个字符开始与主串第i个字符比较,以便不致丢失可能的匹配。 21.这里失败函数f,即是通常讲的模式串的next函数,其定义见本章应用题的第6题。 进行模式匹配时,若主串第i个字符与模式串第j个字符发生失配,主串指针i不回溯,和主串第i个字符进行比较的是模式串的第next[j]个字符。模式串的next函数值,只依赖于模式串,和主串无关,可以预先求出。 该算法的技术特点是主串指针i不回溯。在经常发生“部分匹配”和主串很大不能一次调入内存时,优点特别突出。 22.失败函数(即next)的值只取决于模式串自身,若第j个字符与主串第i个字符失配时,假定主串不回溯,模式串用第k(即next[j])个字符与第i个相比,有‘ p1?pk-1’=‘pj-k+1?pj-1’,为了不因模式串右移与主串第i个字符比较而丢失可能的匹配,对于上式中存在的多个k值,应取其中最大的一个。这样,因j-k最小,即模式串向右滑动的位数最小,避免因右移造成的可能匹配的丢失。 23.仅从两串含有相等的字符,不能判定两串是否相等,两串相等的充分必要条件是两串长度相等且对应 搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新工程科技数据结构第4章 (2)全文阅读和word下载服务。
相关推荐: