基于大数据技术的基站节能方案研究
By 金慧宁@杭州泰联
摘要:随着通信技术的发展和广泛应用,基站能耗问题已成为电信运营商乃至各地政府的关注热点。近年来,工业界和学术界开始尝试应用大数据技术进行基站节能减排的尝试,但是仍处于实验阶段,尚未在实际中进行推广。本文就这一问题进行了思考,并结合实际,就大数据与基站节能问题的结合需要考虑的研究范围和内容提出了相应的观点。特别的,就工业界目前比较认同的基于载波上下电的基站能耗技术(CBES)进行了深入的分析。并提出一种利用大数据改进的CBES方法,即从扇区的粒度对所覆盖区域的流量进行考察分析,利用大数据技术从大量扇区流量数据中对扇区进行细粒度的分类,进而获得较好的节能效果。
背景
环境问题越来越受到世人的关注,温室效益、酸雨、粉尘及频繁的自然灾害已经开始影响到人类的生存。随着人类环保意识的增强,节能减排已经成为关系到民生的重要问题。通信行业虽然不是高耗能,高污染的产业,但庞大的网络和用户群,已经对环境造成了影响。我国通信网络规模世界第一,据权威机构统计,2010年我国三大电信运营商企业的电力能耗是334亿度,折合为二氧化碳排放量约3330万吨。十二五期间,中国通信用户将超过13亿,其网络基础设施投资将超过2万亿元,这些势必导致通信行业能源消耗进一步增长。通信行业作为支撑经济社会发展的战略性、基础性和先导性行业,国家主管部门对通信行业节能减排工作十分重视,在国家通信业“十二五”发展规划中,明确提出2015年单位电信业务总量综合能耗要比2010年下降10%,并要求通信行业对全社会节能减排的贡献进一步加大。因此,无论是从企业本身的社会责任,还是从自身的降本增效的角度考虑,都应该重视节能减排。
目前各大通信运营商在全国部署了数目众多的基站,截止2014年底,仅在上海部署的3G/4G基站已超过2400个,这些基站的能源消耗量占据了整个网络能源消耗的绝大部分(约75%)[1,2]。因此,如何降低基站的耗电多少直接关系到移动运营商节能减排的效果。通常,基站能耗主要分为两大块(各约占50%),即外围设备能耗(如温控、电源损耗等)以及通信主设备能耗(信号处理、功率放大等)。相较于能耗较为固定的外围设备,通信主设备能耗受流量负载影响较大,所以根据实际流量负载动态调节基站能耗能将有助于实现基站节能效果。实际中基站流量负载变化在时间和空间上呈现多样化的特点,若实现基于负载的基站节能目的,就需要对所有基站的流量变化情况进行分析。然而,现有基站控制系统记录了大量的流量变化数据,如以上海3G为例,一天当中用户与基站通讯交互日志信息就多达300GB,从如此大规模的基站流量数据中进行相关流量模式的分析和分类将面临着重大挑战。因此,如何将大数据技术用于基站能耗分析以及相关节能技术的研究,正在成为业界日益感兴趣和期望完整技术解决方案的一个热点领域。
大数据指导基站节能研究内容
我们根据实际调研和大数据应用情况提出如下三大方面有关基站节能的研究内容:
大数据技术在移动通信网络节能领域中的应用:移动通信网络的能耗虽然受诸多因素的影响,但主要可分为静态能耗和动态能耗两大部分。其中,动态能耗与用户的通信行为、通信方式和通信内容等因素密切相关,因此如何利用相关大数据处理技术,从海量的网络业务数据中去挖掘不同类型业务对网络动态能耗贡献的大小和影响因素,并根据大数据的分析结果,建立相应的基站业务能耗模型,以此作为制定网络能耗管理策略的依据,指导网络节能解决方案的设计和实施,这些都是当前应用大数据到基站能耗分析领域需要研究的关键内容。
面向能耗分析的大数据预处理系统平台研制:移动通信网络中,与能耗相关的数据类型有多种多样,而这些数据均来源于不同的基站子系统,如MR、CHR、工参数据等。在能耗分析时,工程师需要对这些异构的数据进行统一的预处理然后分析才能确定具体的能耗原因,进而制定不同的节能策略。这一过程是十分繁琐的过程,其间涉及大量的编码工作对数据进行清洗、去重、过滤、聚合等操作。另外,考虑到大数据的情况,有时候还需要工程师具备分布式编程的能力,使得数据预处理门槛变高,人力、物力、时间等成本增加。因此,需要开发一个面向能耗分析、可定制化的大数据预处理平台,以图形化或web界面的方式方便能耗分析人员操作,在减轻数据预处理难度的同时,也能提高相关能耗数据预处理速度。
基于大数据的基站扇区流量分析及节能技术方案的研究:基站扇区(覆盖区)下会有不同的载波配置,现有基站节能方法主要从载波的上下电角度出发,对这些扇区的流量进行监控,然后根据预先设定的高低门限值进行载波的上下电操作。但是,现有方法在载波上下电门限值的设定上是基于工程师的经验,采用统一的值,使得基于载波关断的节能效果不明显。此外,由于基站通常被划分为不同的扇区,且不同扇区的流量在时间和空间上存在多样化的特点,所以,为了获得较为准确的流量门限值,需要从扇区的粒度对所覆盖区域的流量进行考察分析,利用大数据技术从大量扇区流量数据中对扇区进行分类。而对扇区的流量分析,也与传统的以基站为单元的流量分析不同,粒度更细,能发现更多有价值的流量模式信息。之后,根据基站业务模型和流量模式进行分析,提出扇区载波智能关断的技术方案,并确定最优的载波上下电阈值。
本文接下来将重点围绕上述第3点研究内容展开讨论,即基站细粒度负载分析与节能方案,把学术界和工业界的相关方法简单的做比较,并较为详细的介绍我们目前拟采用的技术思路。
基于载波上下电的基站能耗(CBES)技术概述
基站能耗问题在学术界和工业界均是关注的热点,随着移动用户数的不断增加,以及用记对网络性能的要求越来越高,基站的数目逐年增加。我们拟从软件的角度出发,来探讨基站能耗问题。目前在学术界,大多数方法[3,4]是依赖关闭基站的做法达到节能的目的,但在实际中,关闭基站并非易事,是一个耗时、耗资源的工作:它不仅需要花相对较长的时间进行基站的关闭-开启操作,还需要更新核心网内的一些信息,如“邻近网格ID”。还有一类方法是通过一种称为cell discontinuous transmission (DTX)[5]的技术,这种技术是通过将基站的一些组件在空闲时间休眠化而达到节能的目的。但是这类技术也存在一些缺陷,如通信网格(cell)获取时间增加以及交换(handover)可靠性降低等。
事实上,在一个基站的所有部件中(如图1所示,以3G基站为例),功率放大器(Power Amplifier,PA)是耗能最多的,大概占据基站全部能耗的65%左右[6]。它主要给载波(carrier)设备提供电源以支持其正常工作。载波一般安置在射频拉远单元(RRU)部件上,负责信号的放大传递,是基站主设备中耗能最多的部件,大约占了60%的能耗。在2G网络中,载波的容量较小,通常一个基站会配置有多个载波。在3G/4G网络中,虽然单个载波的容量有了大的提升,但同时为了满足用户对网络性能的需求,越来越多的基站在用户集中的扇区(我们把一个RRU所覆盖的区域称为扇区)进行了多载波的配置。据2014年上海3G基站数据统计,80%以上的基站采用了多载波配置。此外,相对于关闭整个基站来说,对载波进行关闭和开启则容易的多。此外,一般来说,一个基站中载波数目越多,由功率放大器消耗掉的电能越多,因此基于载波关闭的基站节能方法(Carrier Based Energy Saving, CBES)便成了工业界目前比较认可的方式。
图1 传统3G基站内部组件图
关闭载波一般要根据实时的用户连接数进行判断,若低于一定的阈值,基站控制中心系统则会进行将相应的载波进行下电。目前,供应商提出的解决方案对所有基站上的载波采用了相同的阈值,这样的做法并不能在很大程度上进行节能,所以运营商并不买单。为此,我们拟通过分析实际各基站所在扇区不同时间的用户流量,对所有基站按照其负载变化的相似程度进行归类,针对不同类别的基站采用不同的载波上下电阈值对其进行关闭或开启。
CBES方法与大数据技术融合实践
数据集准备
在本文的实际大数据分析中,我们使用真实的用户流量轨迹、真正的基站部署信息以及配置信息进行综合考虑。真实用户轨迹数据由RNC测量得到,即每当用户设备通过基站拨打电话或使用数据服务时,RNC将会记录这次通讯过程中的相关信息:通讯开始时间、IMSI号码(International Mobile Subscriber Identification Number)、近似的用户终端设备(User Equipment, UE)位置、网格ID以及用户终端连接到该网格的信号强度。结合基站配置信息(如基站位置、每个扇区的载波数量,主同步码等)和用户轨迹信息,我们调查基于载波的流量负载是如何随着时间的变化而变化的。
我们实际使用的数据集来自杭州电信2012年10月某连续6个工作日的3G基站的真实数据,经筛选掉非多载波配置的基站后,在剩余基站收集数据中共有130000个不同的用户终端(由IMSI唯一确定一个用户终端)是活动的。该预处理后的数据集中共包含458个基站,对应1313个扇区。每个扇区有2个载波,即其中一个载波将可能被关闭。
扇区流量画像
考虑到相同基站的不同扇区的流量负载和模式可能不相同,我们对不同扇区的流量负载进行了测绘,统计了每个载波每分钟总IMSI号码个数和其形成的时序(Time Series, TS)型数据流量,即每个时间点对应的用户数。扇区时序流量是其对应所有载波时序流量之和。因此下文的流量负载可以代表用户终端数量。
首先讨论基站的不同扇区每天是否具有相同流量负载。我们记录了一个基站的不同扇区在一天内的每分钟流量,和其各自的最大最小值。之后我们计算了它们的最大最小值比率。图2显示了不同基站之间的扇区的流量变化的CDF(Cumulative Distribution Function)值。CDF超过72.4%的最大-最小流量比值大于2,大约27%的这个比值大于5。最高的比率甚至达到了80,这说明不同扇区的流量负载情况有很大不同。
图2 基站扇区流量的多样性
图3 一个基站中的不同扇区
而相同基站的不同扇区之间的流量模式也存在不同。同个基站的三个扇区的时序绘图可予以证明。如图3所示,三个扇区的流量模式的拟合线都互不相同。最高的扇区时序流量变化趋势在18:00之后和中间的扇区时序不同。最低扇区时序流量呈现的趋势和另外两者完全不同。
基站流量负载和流量模式不同的原因在于不同的扇区覆盖不同的区域,这些区域里的人类活动和使用用户终端的行为都在发生着空间性和时间性的变化。由此可以得出,不同扇区时序型流量应该有最适合载波关断周期。因此需要对不同扇区上的流量按照时序数据处理并进行分类。
流量分类与载波关闭
下文对扇区时序流量进行分类,并且提出载波关断或打开的策略。这里的假设载波容量相同,相同扇区每天的载波模式也是相同的。
分类的准备工作:在现实情况下,载波容量涉及很多因素,例如:同时在线的用户设备数量,用户设备使用时的服务状态,用户设备和基站的通信距离等。为了使其更加简单并且针对流量变化趋势分析,我们首先从每天同一时刻的最大流量负载和平均流量负载两个角度估计了载波容量。因此每个网络生成两个新的时序型流量,TSmax-cell和TSave_cell。我们将两者的最大值点作为各自的载波容量,也就是50和40。同理我们对扇区生成了TSmax_sector和TSave_sector也做了上述处理。结合对载波容量的估计结果,我们在扇区粒度上对基站流量进行分类。对数据进行分类分为如下两步。第一步,根据每个扇区的最大流负载将扇区分成两个组(一组的扇区流量一直比载波容量要小,二组的扇区流量有时会比载波容量大)。第二步,再将它们进一步分类,并识别出它们的流量模式。结果,我们得到了三种基本流量模式以及针对它们各自的载波关断通信策略。
流量类型1:同一天内,扇区流量负载最大值一直低于载波容量。
对应的策略:同时提高上下电阈值来增加保持载波关闭的可能性。
图4(a)和图5(a)显示的是TSmax_sector和TSave_sector的流量负载的CDF最大值。可以看出,TSmax_sector和TSave_sector分别在50,40时CDF曲线就已趋于平缓。图4(a)中,当比率为30时,有95.28%的扇区可以在一个载波关闭的情况下安全运行一整天,在图5(a)中这个数据是96.5%。因此提高这些扇区的CBES方法上下电阈值则可以达到有效载波关断。
图4 TSmax_sector 角度
图5 TSave_sector 角度
之后,我们从上述的两个方面也对二组扇区流量使用无监督的机器学习分类方法,层次聚类(HC)[7],得到了相似的结果,该方法可以将所有流量模式以树图的形式呈现而不用设计其他聚类参数。由此发现另外两种流量模式,如图4(b)和5(b)与4(c)与5(c)。
流量模式2:白天(早上9点到晚上8点)流量负载更高,可能高于载波容量,黑夜则较低。
策略:在白天将下阈值降低,保持载波开启,尽早在黑夜将下阈值升高,可以将一些载波关闭。
图4(b)显示的从TSmax_sector处看流量模式2的流量负载的变化规律。被选中的33个扇区的流量峰值都超过了载波容量,而且它们的都出现在白天(早上9点到晚上8点)。人们的一些日常行为可以解释这一情况,人们在白天工作,夜间休息。在图5(b)中,这样的扇区则有32个,因此这些扇区可以被分类成一类,所以应该将CBES方法的下阈值在白天降低,在夜间升高。
流量模式3:夜间流量负载更高,可能高于载波容量,白天则较低。
策略:在白天升高下阈值来关闭一些载波以节省能源,在黑夜降低下阈值并保持载波开启。
根据图4(c)和图5(c)的流量模式3流量负载情况显示,分别有20和14个扇区是属于流量模式3的。他们的趋势是晚上的流量负载比早上更高一些,红色的长方形显示的是其峰值及高出载波容量的部分。虽然他们的趋势有所不同,但是峰值在夜晚都超过了载波容量。这一现象在现实生活中也很常见,这些扇区覆盖的地方大多是如酒吧一般的24小时营业的娱乐场所,人们大多在晚上出没这些地方。因此我们给出的策略则正好与流量模式2相反,在白天升高下阈值则可关闭一些载波,在黑夜降低下阈值可保持载波开启。
根据上述的三种流量模式和其相应的对CBES的操作策略,则可以达到节能的目的和更好的经济效益。
63总结
本文首先从大数据技术与基站节能出发阐述了可以研究的范围和具体的三个研究内容。随后针对目前工业界比较认可的基于载波上下电的节能方式(CBES)进行了重点阐述,并基于大量真实的3G大数据,给出了相应的大数据优化方案。我们通过大数据分析发现,基站的不同扇区具有不同的流量模式和流量负载。依据层次聚类,我们将流量模式分成三类。目前,我们的工作对于一个基站载波何时关断是不够精确的,但是,如果将在一个长时间范围内的流量趋势联系起来时,则可以对指导CBES操作员节约通信网络能源损耗提出建设性意见。未来,我们将从以下几点进行改进:找出影响载波容量的决定性因素;量化本文给出的策略所能够达到的节能效果;细化流量模式优化方法;预测实时流量变化,使得通信网络更加适应周围流量。
参考文献:
[1] Save energy and reduce emissions to achieve sustainable development and improve corporate competitiveness. Technical report, Huawei Whitepaper for Saving Energy and Reducing Emissions, 2012.
[2] Y. Chen, S. Zhang, S. Xu, and G. Y. Li. Fundamental trade-offs on green wireless networks. IEEE Communications Magazine, 49(6):30–37, 2011.
[3] C. Peng, S.-B. Lee, S. Lu, H. Luo, and H. Li. Traffic-driven power saving in operational 3g cellular networks. In Proc. of the ACM MobiCom, pages 121–132, 2011.
[4] N. Saxena, B. Sahu, and Y. S. Han. Traffic-aware energy optimization in green lte cellular systems. IEEE Communications Letters, 18(1):38–41, 2014.
[5] S. Tombaz, S. wook Han, K. W. Sung, and J. Zander. Energy efficient network deployment with cell dtx. IEEE Communications Letters, 18(6):977–980, 2014.
[6] D. Feng, C. Jiang, G. Lim, L. J. Cimini Jr, G. Feng, and G. Y. Li. A survey of energy-efficient wireless communications. IEEE Communications Surveys & Tutorials, 15(1):167–178, 2013.
[7] S. Bandyopadhyay and E. J. Coyle. An energy ecient hierarchical clustering algorithm for wireless sensor networks. In Proc. of the IEEE INFOCOM, pages 1713–1723, 2003.