软件工程中的系统文献映射研究-设计和执行过程的第二步

接着上一篇(“软件工程中的系统文献映射研究-简介、设计和执行过程的第一步”),继续讲软件工程中的系统文献映射研究。

2. 系统文献映射研究的执行过程

在确定了研究目标和研究问题后,往往需要设计系统文献映射研究的执行过程。该过程一般包含文献的试验性检索和筛选过程和文献的正式检索和筛选过程。

以下先给出文献的正式检索和筛选过程的流程(没有完全遵从UML流程图的画法,意思表达清楚即可)。文献的试验性检索和筛选过程是文献的正式检索和筛选过程的简化版。

虽然我们说文献的试验性检索和筛选过程是正式检索和筛选过程的简化版,但其不可或缺。因为我们最初的很多设计(比如在什么数据库里检索,使用什么检索表达式,采用什么筛选标准等)其实本身就是假设条件。例如,我们不确定,但相信(也许是凭经验)在某某数据库中检索就可以得到我们需要的结果,所以我们将该数据库纳入数据库检索的范围。为了检验我们的设计(移除我们所做的假设条件的不确定性),我们可以通过文献的试验性检索和筛选过程实现。以下举几个我在做假设条件系统文献映射研究时遇到的问题以及解决方案作为例子。

(1)在不同的数据库中检索文献  

因为不同的数据库采用不同的检索引擎并提供不同的检索能力,文献的试验性检索和筛选过程帮助我们寻找在不同数据库中适合的检索方法。例如某些数据库提供选择研究领域以及语言的选项,通过选择研究领域为计算机科学以及语言为英语可以提高后续步骤的效率。  

(2)检索词的使用  

文献的试验性检索和筛选过程帮助精化检索词。我之前的研究遵循了以下步骤以识别最佳的检索表达式:

(a)虽然在英语字典中识别出“assumption”的同义词和近义词,但是这些同义词和近义词在相关工作中并非都与“assumption”具有同样的语义。例如许多文献使用“guess”或者“hypothesis”,但是除非这些文献显式地指出其使用的其他术语与“assume”或者“assumption”等同,否则无法推测这些文献中的相关术语与“assumption”含有相同的意义。

(b)为了使检索符合软件开发的背景,该研究最初使用了以下检索表达式:“(software engineering OR software development OR system development) AND (…)”。然而我们发现许多符合条件的文献在其标题或者摘要中仅仅提到例如“software”,而不是“software engineering”或者“software development”。

(c)进一步试验了以下检索表达式:“(assume OR assuming OR assumption)”、“system AND (assume OR assuming OR assumption)”、“program AND (assume OR assuming OR assumption)”、“(requirement OR design OR architecture OR component OR source code OR testing) AND (assume OR assuming OR assumption)”。然而采用上述表达式检索得到的结果的数量极为庞大。例如,采用检索表达式:“(assume OR assuming OR assumption)”在IEEE Explore数据库中检索2001年到2015年的文献,其检索结果为82650篇。

(d)为了平衡该系统文献映射研究的价值以及需要付出的努力,我们最终选择了以下检索表达式:“(software) AND (assumption OR assume OR assuming)”。需要注意的是这种选择可能会导致遗漏相关文献的风险。  

(3)第一轮的筛选方式  

在某些情况下,只阅读一篇文献的标题无法帮助判断该文献是否应入选。所以我们决定在正式的检索和筛选过程的第一轮筛选中同时阅读文献的标题和摘要。  

(4)入选的文献  

文献的试验性检索和筛选过程帮助精化选择标准。例如该研究识别出两类文献:

(a)关于软件开发中的假设条件的文献;

(b)关于方法或工具的假设条件的文献。

此外,一些文献仅仅提到假设条件的术语,但并未展开或者未包含任何可以回答研究问题的数据。为避免博而不精的情况,我们决定只入选那些在软件开发中考虑假设条件的文献,而排除那些缺少足够数据以回答研究问题的文献。  

(5)研究者之间达成一致的方式  

文献的试验性检索和筛选过程帮助研究者之间就多方面达成一致。例如,为就选择标准达成共识,我们选取了一百篇文献作为样本,并讨论每一篇为什么应该入选或排除。

再给一个我们在做假设条件系统文献映射研究时,文献的试验性检索和筛选的流程作为例子。

从上图可以看到,一个研究者(R1)在IEEE Explore数据库中检索和筛选文献,另一个研究者(R2)在Wiley InterScience和ISI Web of Science数据库中检索和筛选文献。此外,还有第三位研究者评审检索和筛选的结果。

猜你喜欢

转载自blog.csdn.net/ytomc/article/details/82525947
今日推荐