为数据库开发的云效率平台

普渡大学数据科学和机器学习教授开发了OPTIMUSCLOUD,旨在为组织和用户提供云计算效率,以应对COVID-19大流行等数据密集型情况。

通过克里斯·亚当 2020年6月5日

普渡大学的一位数据科学和机器学习教授希望帮助组织和用户在使用基于云的数据库时获得最大的收益。她的技术除了在数据密集型的COVID-19大流行期间帮助数据库外,还可以帮助自动驾驶汽车在延迟成为主要问题时更安全地在道路上运行。

索索马里·查特吉是普渡大学农业和生物工程助理教授创新的细胞和神经机器[ICAN]她的团队创造了一种名为OPTIMUSCLOUD的技术。

该系统旨在帮助实现云托管数据库的成本和性能效率,合理分配资源,使云供应商和客户都受益,因为他们不必为故障安全操作过度配置云托管服务器,因为数据中心节省的成本可以传递给他们。

Chaterji说:“它还可能帮助那些在远程数据中心处理研究数据的研究人员,在大流行期间,由于远程工作条件,吞吐量是优先考虑的问题。”“这项技术起源于增加数据管道吞吐量的愿望,以处理微生物组或宏基因组数据。”

普渡大学的技术与三大云数据库提供商合作:亚马逊的AWS、谷歌cloud和微软Azure。Chaterji说,通过一些工程方面的努力,它还将与其他更专业的云提供商合作,如Digital Ocean和FloydHub。

它以亚马逊的AWS云计算服务为基准,采用了NoSQL技术Apache Cassandra和Redis。

Chaterji说:“让我们通过优化数据库的使用方式来帮助您获得最大的效益,无论是本地数据库还是云托管数据库。”“它不再只是计算上的繁重工作,而是高效的计算,你使用你需要的东西,并为你使用的东西付费。”

Chaterji表示,目前使用自动化决策的云技术通常只适用于短时间重复的任务和工作量。她说,她的团队创建了一个最佳配置来处理长时间运行的动态工作负载,无论是来自连接农场中无处不在的传感器网络的工作负载,还是来自科学应用程序的高性能计算工作负载,或者目前来自世界各地的COVID-19模拟,急于找到对抗病毒的治疗方法。

Chaterji说:“我们的合理规模的方法越来越重要,因为在云上运行的无数应用程序,数据的多样性和从数据中获取见解所需的算法,因此需要使用异构服务器来分析数据流,这些服务器的成本相差很大。”Amazon EC2上按需实例的价格相差超过5000倍,这取决于您使用的虚拟内存实例类型。”

Chaterji表示,OPTIMUSCLOUD有许多应用程序,用于自动驾驶汽车(延迟是优先考虑的问题)、医疗保健存储库(吞吐量是优先考虑的问题)以及农场或工厂的物联网(IoT)基础设施。

OPTIMUSCLOUD是一个与数据库服务器一起运行的软件。它使用机器学习和数据科学原理来开发算法,帮助共同优化虚拟机选择和数据库管理系统选项。

Chaterji说:“此外,在这个奇怪的时期,像我们这样传统上计算密集型的实验室和湿实验室都依赖于计算存储,比如对COVID-19的传播进行模拟,这些云托管虚拟机的吞吐量至关重要,即使利用率的轻微提高也会带来巨大的收益。”“考虑到目前,即使是最好的数据中心的利用率也不到50%,因此传递给最终用户的成本也大大增加了。”

Chaterji补充说:“当涉及到云数据库和计算时,当你只需要一个轮胎时,你不会想要购买整辆车,尤其是现在每个实验室都需要一个轮胎来巡航。”


作者简介:克里斯·亚当,普渡大学